특별기고 |
배진건(이노큐어 테라퓨틱스, 수석부사장)
AI는 CRISPR의 RNA-타깃팅 효과를 예측하고 유전자 치료에 혁명을 일으킨다.
'크리스퍼 캐스나인(CRISPR/Cas9) 유전자가위'는 생명 정보를 담은 유전체의 특정 DNA를 정확히 찾아 잘라낼 수 있는 교정기술로 그동안 치료할 수 없었던 유전병의 치료제 개발 및 식량문제를 해결하는 종자개발 등에 활용될 수 있는 원천기술이다. 특히 2020년 에마뉘엘 샤르팡티에 독일 막스플랑크연구소 교수와 제니퍼 다우드나 미국 버클리 캘리포니아대 교수가 공동으로 노벨화학상을 수상하며 이 기술은 더욱 주목을 받았다. 최근 과학자들은 Cas9대신 Cas13이라는 효소를 사용하여 RNA를 표적으로 하는 또 다른 유형의 CRISPR를 만들었다.
유전자가위로 치료제를 개발하는 전 세계 42개 기업 및 연구소가 진행중인 전임상/임상 시험이 250개가 넘는다. 이들 파이프라인들을 하나로 정리한 그래프를 최근 페북(facebook)에서 보았다. 물론 이중 85%는 초기 단계 전임상 진행중이지만 이 기술에 대한 개발 경쟁의 뜨거움을 요즈음 여름 날씨처럼 뜨겁다[그림 1].

이 엄청난 파이프라인의 최고봉은 '엑사셀(exa-cel)'이다. 미국 제약사 버텍스(Vertex)는 지난 6월 8일 크리스퍼 테라퓨틱스(Crisper Therapeutics)와 함께 2015부터 개발한 베타지중해 빈혈(TDT)과 겸상(낫)적혈구병(SCD)치료제 후부 엑사셀(exa-cel/exagamglogene autotemcel)에 대한 FDA 승인신청이 수락됐다고 밝혔다. 엑사셀은 환자의 줄기세포를 꺼내 체외에서 CRISPR/Cas9으로 유전자 편집과정을 진행한 이후 다시 환자에게 주입하는 자가(동종)유래 체외 유전자 편집 세포치료제다.
지난 7월 3일 자 'Nature Biotechnology'에 "Prediction of on-target and off-target activity of CRISPR–Cas13d guide RNAs using deep learning"라는 제목의 논문이 게재되었다. 뉴욕 대학, 컬럼비아 엔지니어링 및 뉴욕 게놈 센터의 연구자들에 의한 이 연구는 심층학습(deep learning) 모델과 CRISPR 스크린을 결합하여 다양한 방식으로 인간 유전자의 발현을 조절한다. 이 새로운 기술은 세포에서 유전자 활성의 미세 조정을 가능하게 한다.
연구자들은 RNA 제어를 더 깊이 이해하고 비코딩(non-coding) RNA의 기능을 확인하기 위해 Cas13을 사용한 'RNA 표적 CRISPR 스크리닝 플랫폼'을 만들었다. 새로운 연구에 따르면 인공지능(AI)은 DNA가 아닌 RNA를 표적으로 하는 CRISPR 도구의 온타깃(on-target)및 오프타깃(off-target)의 활동을 정확하게 예측하는 'TIGER(Targeted Inhibition of Gene Expression via guide RNA design, 가이드 RNA 설계로 유전자 발현의 표적화 억제)'라고 이름 지은 하나의 심층학습 모델을 개발한 것이다.
이 연구의 중요한 목표는 의도한 표적 RNA에 대한 RNA 표적화 CRISPR의 활성을 극대화하고 세포에 해로운 부작용을 일으킬 수 있는 다른 RNA에 대한 활성을 최소화하는 것이다. 오프타깃 활성에는 삽입 및 결실 돌연변이뿐만 아니라 가이드 RNA와 타깃 RNA 사이의 불일치가 모두 포함된다.
RNA를 표적으로 하는 CRISPR에 대한 이전의 연구는 표적활성과 불일치에만 초점을 맞추었다. 그러기에 오프타깃 활성, 특히 삽입 돌연변이 및 결실 돌연변이의 예측에 대해서는 충분히 연구되지 않았다. 인간 유전자는 약 5건에 1개의 돌연변이가 삽입되거나 결실되어 존재하기 때문에 이들은 CRISPR 설계에서 고려해야 할 중요한 유형의 잠재적인 오프타깃이다.
Nature Biotechnology에 게재된 논문을 조금 더 구체적으로 설명한다. 연구진은 인간 세포의 필수 유전자를 표적으로 하는 20만 개의 가이드 RNA의 활성을 측정했다. 먼저 "완전 일치" 가이드 RNA와 삽입 및 결실을 포함하여 오프타깃의 "불일치" 가이드 RNA로 구분하였다.
Sanjana 교수의 연구실은 기계 학습 전문가 David Knowles 교수의 연구실과 협력하여 CRISPR 스크린의 데이터로 훈련된 TIGER(Targeted Inhibition of Gene Expression via guide RNA design, 가이드 RNA 설계로 유전자 발현의 표적화 억제)라고 이름 지은 심층학습(deep learning) 모델을 설계했다.
심층학습 모델과 실험실에서 세포를 사용한 테스트에 의해 생성된 예측을 비교하였다. TIGER는 RNA를 표적으로 하는 CRISPR의 온타깃 활성과 오프타깃 활성을 모두 예측할 수 있는 첫 번째 도구가 되었다. Cas13 온타깃 가이드 설계용으로 개발된 이전 모델의 예측과는 비교되지 않는다.

기계학습(machine learning)과 심층학습은 현대의 'high-throughput' 실험에서 생성하는 거대한 데이터 세트를 분석할 수 있기 때문에 genomics 분야에서 그 강점을 발휘하고 있다. 중요한 것은 모델이 특정 가이드가 잘 작동한다고 예측하는 이유를 이해하기 위해서는 "해석 가능한 기계 학습"을 사용할 수 있다는 것이다." 요크 게놈 센터와 콜롬비아 공학부의 컴퓨터 과학 및 시스템 생물학 조교수이자 뉴칼레도니아 대학의 교수인 Knowles는 말한다.
"우리의 이전 연구는 특정 RNA를 넉다운(knock down) 할 수 있는 Cas13 가이드를 설계하는 방법을 입증했다. 그렇기에 새로운 Cas13 가이드를 설계할 수 있게 되었다.”라고 이 연구의 공동 첫번째 저자이자 뉴욕 게놈 연구소의 수석연구원인 Hans-Hermann Wessels는 말했다.
"우리의 심층학습 모델은 전사체를 완전히 'knocks down' 하는 가이드 RNA를 설계하는 방법을 가르쳐 줄 뿐만 아니라 이를 조정(tune)할 수 있다. 예를 들어 특정 유전자의 전사물을 70%까지만 생성하는 것이다." 콜롬비아 엔지니어링과 뉴욕 게놈 센터의 박사과정의 학생이자 이 연구의 공동 필두 저자인 앤드류 스턴은 말한다.
"CRISPR 스크린에서 더 많은 데이터 세트를 수집함에 따라 기계학습 모델이 더 정교해지기에 적용할 수 있는 기회가 급속히 증가하고 있다. 다행히도 'David'의 연구소는 우리 방 옆에 있기에 이 영역을 뛰어넘어는 놀라운 협업을 촉진할 수 있다. TIGER를 사용하면 오프 타깃을 예측하고 유전자 양을 정확하게 조절할 수 있으므로 생물의학에서 RNA 타깃팅 CRISPR의 많은 새로운 응용이 가능하다."라고 주 저자 Sanjana 교수는 말한다.
정확한 가이드 예측과 오프타깃을 파악하는 것은 새로운 CRISPR 분야와 치료법에 매우 가치가 있다. 인공지능과 'RNA 타깃팅 CRISPR 스크리닝'을 결합하여 TIGER 예측이 바람직하지 않은 오프타깃 CRISPR 활성을 회피하는 데 도움이 되며, 신세대 RNA 타깃팅 치료법의 개발을 더욱 촉진할 것이다.
특히 중요한 것은 오프타깃 효과를 예측함으로써 TIGER는 유전자량의 정확한 조절을 가능하게 하여 다운증후군, 특정 정신분열증, 샤르코 마리투스병, 특정 암 등의 증상 치료에 유익해질 수 있는 가능성을 제공한다. 이번 연구는 유전체학에서 기계학습과 심층학습의 강점을 활용하고 CRISPR 스크리닝의 대규모 데이터 세트를 활용하여 치료 전략을 개선할 것이다.
관련기사
- 간-뇌 연결축(Liver-Brain Axis)을 아시나요?
- 타우린 부족은 노화를 촉진시키는 주범인가
- "PLD가 세포막에서 영역 넓혀 알츠하이머 치매(AD)로 이동한다"
- 좋은 콜레스테롤(HDL)은 알츠하이머 친구인가, 적인가
- 달콤한 설탕은 어떻게 알츠하이머 위험을 높이나
- "김형석 교수님 유전자와 진시황을 따르는 최고 부자들"
- K바이오! 당신은 '강제혁신' 할 것인가, 당할 것인가
- "아밀로이드-타우 연결 푸는 작업이 알츠하이머 신약개발의 열쇠"
- 'RNA 결합 단백질'이 타우(Tau) 응집을 방지한다면?
- '인슐린유사 성장인자(IGF)'는 어떻게 신경가소성을 강화하나
- 달콤한 '빵의 단백질 글루텐'은 사람의 뇌에도 영향 미칠까
- PLCγ2 M28L 변형, 기억상실 악화…P522R은 신경 보호 촉진
- 美 버텍스, 낭포성 섬유증 '굳히기 모드'…1형 당뇨까지 "홈런 준비"
- "희귀질환 유발 '융합 단백질을 삭제하는 치료제' 필요"
