바이러스 회피 면역, 언어 분석 모델 포착 -Sciencetimes

독감 및 후천성 면역 결핍 증후군 (HIV)과 같은 일부 바이러스에 대한 효과적인 백신을 개발하기 어려운 한 가지 이유는 이러한 바이러스가 매우 빠르게 변이하기 때문입니다.

돌연변이 된 바이러스는 ‘바이러스 탈출’이라는 과정을 통해 특정 백신에 의해 생성 된 항체를 피할 수 있습니다.

얼마 전 예방 접종을했던 코로나 19도 전 세계 여러 곳에서 균주 의심으로 나타났다. 이로 인해 일부 사람들은 백신의 효과에 의문을 제기했습니다. 실제로 인플루엔자 바이러스에는 많은 변종이 있으며, 새로운 변종을 예상하여 매년 새로운 백신이 만들어지고 접종됩니다.

최근 미국 MIT (Massachusetts Institute of Technology) 팀은 언어 분석 모델을 기반으로 ‘바이러스 탈출’을 계산 모델링하는 방법을 고안했으며 제조의 새로운 전환점을 준비 할 수 있을지 주목할 만합니다. 바이러스 및 암 백신.

이 모델은 바이러스 표면 단백질의 어느 부분이 바이러스 탈출을 허용하는 더 높은 돌연변이 확률을 가지고 있는지 예측할 수 있으므로 이론적으로는 돌연변이 확률이 낮은 영역을 대상으로 효과적인 백신을 개발할 수 있습니다.

미국의 MIT (Massachusetts Institute of Technology) 팀은 COVID-19를 포함하여 독감 및 HIV에 효과적인 백신 개발을 돕기 위해 ‘바이러스 탈출’을 계산적으로 모델링하는 방법을 고안 할 것으로 예상됩니다. © MIT 뉴스

“바이러스 탈출은 큰 문제입니다”

MIT의 수학과 컴퓨터 과학 및 인공 지능 연구소의 석좌 교수 인 Bonnie Berger 교수는 “바이러스 탈출은 큰 문제입니다. “바이러스 탈출은 큰 문제입니다. HIV 엔벨로프 표면 단백질의 돌연변이로 인한 ‘바이러스 탈출’로 인해 다양한 독감 바이러스와 잘 어울리는 보편적 인 독감 백신이없고 HIV 백신도 없기 때문입니다.”

이 상황에서 버거 교수 팀은 HIV와 COVID-19를 유발하는 SARS-CoV-2의 독감과 돌연변이와 싸울 수있는 백신 표적을 확인하고 15 일 과학 저널 ‘사이언스’에 게재했다.

논문이 출판 승인을받은 후 연구팀은 최근 영국과 남아프리카에서 출현 한 새로운 SARS-CoV-2 균주에 모델을 적용하고 분석했습니다. 이 분석 문서는 아직 전문가 스크리닝을 완료하지 않았지만 SARS-CoV-2가 현재 백신 접종을 피할 가능성이 있는지에 대한 추가 조사가 필요한 바이러스 유전 서열을 표시했습니다.

이번 연구에서는 버거 교수와 생물 공학과의 브라이언 브라이슨 조교수가 논문의 선임 저자로 참여했고, 컴퓨터 과학과의 브라이언 히에 박사가 논문의 제 1 저자로 참여했다.

이 연구의 대상이었던 독감, HIV 및 코로나 -19 바이러스는 매년 많은 사망을 초래합니다. 사진은 비디오를 캡처합니다. © MIT의 AI 및 건강

언어 무늬 예측 모델 분석 모델로서 용도

다른 유형의 바이러스는 다른 속도로 유전 적 돌연변이를 획득하며 HIV 및 독감 바이러스는 가장 빠른 돌연변이 클래스 중 하나로 알려져 있습니다.

연구팀은 이러한 다양한 유형의 바이러스 탈출을 분석하기 위해 자연어 처리 (NLP) 분야의 언어 모델 중 하나의 컴퓨팅 모델을 선택하고 두 가지 기준을 설정하여 모델링했습니다. 한 가지 기준은 ‘돌연변이가 바이러스 탈출을 촉진하려면 바이러스 표면 단백질의 모양을 바꿔야 항체가 더 이상 결합 할 수 없도록’하고 ‘모양이 바뀌어도 단백질 기능이 제대로 기능해야한다’는 것입니다.

이 모델은 원래 언어의 패턴, 특히 특정 단어가 함께 나타나는 빈도를 분석하도록 설계되었습니다.

예를 들어이 모델은 “Sally ate eggs for…”와 같은 문장을 완성하는 데 사용할 수있는 단어를 예측할 수 있습니다. 선택한 단어는 문법적으로 정확하고 올바른 의미를 가져야합니다. NLP 모델은이 예에서 ‘아침’또는 ‘점심’을 계란을 먹을 때처럼 예측할 수 있다고 말합니다.

이 경우 ‘문법’은 특정 염기 서열에 의해 암호화 된 단백질이 기능적인지 여부를 판단하는 ‘규칙’과 유사하며, 의미 적으로는 단백질이 항체를 회피 할 수있는 새로운 형태를 취할 수 있는지 여부에 해당합니다. 하다.

연구팀은 이런 종류의 모델이 유전 적 서열과 같은 생물학적 정보에도 적용될 수 있다는 통찰력을 보여주었습니다.

연구팀은이 연구의 핵심이 ‘제한된 의미 변화 탐색’에서 의미가 크게 변하는 문법적 변이를 조사하는 것이라고 밝혔다. 사진은 비디오를 캡처합니다. © MIT의 AI 및 건강

용이하게 가져 오기 번호 있다 유전 주문 정보 만 필요한 것

Hie는 “바이러스가 인간의 면역 체계를 벗어나려고하면 스스로 죽이거나 복제 할 수없는 돌연변이를 일으키고 싶지 않다”고 말했다. “생존 적합성을 유지하되 인간의 면역 체계가 감지 할 수 없도록 위장하십시오. 좋겠습니다.”

이 과정을 모델링하기 위해 팀은 유전자 서열에서 발견되는 패턴을 분석하는 NLP 모델을 훈련했습니다. 그리고이를 통해 새로운 기능을 가지면서도 단백질 구조의 생물학적 규칙을 따르는 새로운 유전 서열을 예측할 수있었습니다.

이 모델링의 한 가지 중요한 장점은 유전자 서열 정보 만 필요하다는 것입니다. 이는 단백질 구조보다 훨씬 쉽게 얻을 수 있습니다. 또한 상대적으로 적은 양의 정보로 훈련 할 수 있다는 장점도 있습니다. 연구팀은이 연구에서 60,000 개의 HIV 시퀀스, 45,000 개의 독감 시퀀스, 4,000 개의 코로나 바이러스 시퀀스를 사용했습니다.

“언어 모델은이 복잡한 분포 구조를 학습하고 유전 적 서열 변이로부터 기능에 대한 통찰력을 얻을 수 있기 때문에 매우 강력합니다.”라고 Hie는 말했습니다. “우리는 각 아미노산 위치에 대해 많은 양의 바이러스 서열 데이터를 가지고 있습니다.”이 있으며, 모델은 훈련 데이터에서 아미노산의 동시 발생 및 공변량 특성을 학습합니다. “

연구팀은 ‘바이러스 탈출’을 차단하는 모델링 개발에 언어 분석 모델의 문법과 의미를 동시에 채택했다. 사진은 비디오를 캡처합니다. © MIT의 AI 및 건강

바이러스 탈출 블록

모델이 훈련되면 연구원들은이 모델을 사용하여 탈출 돌연변이를 일으킬 가능성이있는 코로나 바이러스 스파이크 단백질, HIV 외피 단백질 및 인플루엔자 혈구 응집소 (HA) 단백질 서열을 예측했습니다.

독감의 경우, 모델은 돌연변이 및 바이러스 탈출 가능성이 가장 낮은 서열이 HA 단백질 줄기에 있음을 발견했습니다. 이것은 HA 줄기를 표적으로하는 항체가 모든 독감 균주에 대해 거의 보편적 인 보호를 제공 할 수 있다는 최근 연구와 일치한다고 연구원들은 말했다.

코로나 바이러스 모델 분석에 따르면 S2 서브 유닛이라고하는 스파이크 단백질 중 일부는 탈출 돌연변이를 생성 할 가능성이 가장 낮습니다.

과학 저널 ‘Science’1 월 15 일자에 게재 된 논문. © AAAS / 과학

백신에서 표적 차별 연구 매질

현재 SARS-CoV-2 바이러스가 얼마나 빨리 변이 할 것인지에 대한 의문이 남아 있습니다. 따라서 현재 배포되는 COVID-19 백신의 효과가 얼마나 오래 지속 될지 불분명합니다. 초기 증거에 따르면 SARS-CoV-2 바이러스는 독감 바이러스 또는 HIV만큼 빠르게 돌연변이를 일으킬 가능성이 낮습니다.

그럼에도 불구하고 연구원들은 최근 싱가포르, 남아프리카 공화국, 말레이시아에서 나타난 새로운 돌연변이를 확인하고 이러한 바이러스의 면역 탈출 가능성을 조사해야한다고 믿습니다. HIV에 대한 연구에서 연구원들은 이전 발견과 일치하는 외피 단백질의 V1-V2 초 가변 영역에서 가능한 많은 탈출 돌연변이와 함께 탈출 가능성이 낮은 서열을 발견했습니다.

그들은 현재 다른 연구자들과 함께 자신의 모델을 사용하여 신체의 면역 체계를 자극하여 종양을 파괴하는 암 백신의 가능한 표적을 식별하고 있습니다.

연구팀은 또한 그들의 모델이 결핵과 같은 질병에서 내성을 일으킬 가능성이 적은 저분자 약물을 설계하는 데 사용될 수 있다고 말했다.

브라이슨 교수는 “모델을 사용할 수있는 기회가 많고 필요한 시퀀스 데이터를 쉽게 생성 할 수있어 미래가 밝다”고 말했다.

(50)

Source