김태형 상무가 말하는 ASHG 학회 참관기
영국, 10만명 유전체 데이터 제약 등에 활용
미국, 3년내 100만명 유전체 데이터 축적

10만, 100만, 500만.

이 숫자는 무엇을 의미할까요? 영국은 이미 Genomics England를 설립해 10만명 유전체(genome)를 제약사, 자국 연구기관, 및 타국가 연구기관 까지도 제공하고 있습니다. 미국은 영국을 의식해 ‘All of Us’라는 프로젝트를 발표하며 100만명 유전체 데이터를 분석하겠나고 나섰습니다. 현재까지 27만명의 유전체 데이터 분석을 마치고, 향후 3년 안에 데이터 분석을 마칠 것으로 보입니다. 영국도 앞으로 500만명의 유전체 데이터를 분석하겠다고 발표했습니다. 하지만 세계 대규모 유전체 코호트 지도에 한국만 빠졌있습니다. 

이런 논의가 이뤄진 곳은 지난달 15일부터 19일까지 미국 휴스턴에 열린 미국인간유전학회(ASHG) 학술대회장이었습니다. 1948년 창립해 약 만 명의 회원을 두고 있는 이 학회에는 올해 약 81개국에서 약 9000명이 참가했다고 합니다. 히트뉴스는 김태형 테라젠이텍스 바이오연구소 상무를 만나 이번 학회에서 논의된 신약개발과 접목될 수 있는 유전체 데이터의 현재와 미래에 대해 물었습니다. 또 국내 상황과 테라젠이텍스 바이오연구소, 유전체 기반 신약개발에 대해서도 들어봤습니다. 김 상무는 인터뷰를 위해 학회 참관기 PPT 파일과 함께 ASHG19에 발표된 공개된 툴과 리소스 엑셀 파일을 공유해 줬습니다.(첨부문서 참조)

김태형 테라젠이텍스 상무

유전체 데이터, 기초연구서 활용 활용 단계로

ASHG 학회에 참석한 김태형 상무 

-올해 학회에서 특히 주목할만한 게 있었나요?

“기초연구에서 활용의 단계로 넘어가는 변곡점이란 생각이 들었어요. 축적된 데이터의 규모도 10만명 단위로 매우 커졌고요. 23andMe 등 유전체 회사와 연구소 등 250곳이 참여했는데, 제약회사도 이전보다 더 늘어났죠.

또 이전에 단순하게 차세대염기서열분석(NGS) 기술을 통해 유전체 서열(sequence)만 분석했다면, 요즘엔 유전자 표현형(phenotype) 정보를 활용하는 방식도 제시됐어요. 전자의무기록(EMR) 자료 등과 유전체 데이터가 접목되는 방식으로 가고 있어요. 전장유전체 연관분석(GWAS)에서 표현형을 분석하는 전장표현형 연관분석(PWAS)으로 가는 겁니다.”

-한국 참가자는 어느정도였나요?

“300명 정도 참석해서 한국인의 밤 행사도 가졌어요. 포스터 발표도 224건 정도 했고요. 저희 연구소 빅데이터팀이 발표된 논문의 텍스트를 분석해 보니 주요 키워드가 RNA, NGS 기술, 암(cancer), 질병(disorder) 등으로 나오더라고요.”

-코흐트 분석 결과가 대규모로 진행된다고 하셨는데요. 구체적으로 설명해 주세요.

“미국의 All of Us, 영국의 Genomics England가 추진하는 10만 genome project(Genomics England), 미국 소비자직접의뢰(DTC) 기업 23andme가 발표한 내용입니다. 세 곳 모두 공통적인 사항은 축적된 유전체 데이터를 축적, 분석한 뒤 공유하고 활용할 수 있다는 겁니다.

반면 우리나라는 학술적인 목적으로 매우 제한된 환경에서만 활용과 공유가 가능합니다. 이러한 상황을 반영하듯, 한 연구자가 전 세계 유전체 데이터 규모를 지도 한 장으로 정리했는데, 우리나라만 빠져 있었습니다. 유전체 데이터가 다른 국가와 공유가 거의 안 되기 때문인듯 합니다.

 

전세계 바이오뱅크(Global Biobanks). 중국, 일본은 명시돼 있으나 한국은 빠져 있다. 

이런 상황에서 미국은 27만명 유전체 분석을 마치고, 100만명 분석을 향후 3년 안에 이뤄내겠다고 발표했습니다. 영국은 이미 10만명 유전체 데이터를 분석해 국가, 제약사, 연구소를 상대로 연구 목적으로 데이터를 적극적으로 공유하고 활용하고 있습니다. 미국과의 경쟁을 의식한 듯 500만명 유전체 데이터 분석도 발표했죠.”

-23andMe는 어떤가요? DTC 기업인데 소비자 유전체 정보를 다른 곳에 팔 수 있나요?

“엄밀히 말하면 23andMe는 유전체분석검사가 아닌 축적된 데이터를 통해 수익을 창출합니다. 실제로 글로벌 제약사 GSK와 큰 규모의 데이터 계약도 했고요. 이미 소비자에게 검사 시작 전부터 데이터 활용이 계약 조항에 명시돼 있고, 소비자가 특별히 이에 대한 거부감도 크지 않은 것으로 보입니다. 이번에 발표된 논문의 유전체 데이터 역시 23andMe 데이터가 많았습니다.”

-우리나라가 유전체 데이터를 활용 하기 위해 벤치마킹 하기 좋은 나라는 어디일까요?

“영국을 눈여겨볼 필요가 있습니다. 전 세계 최초로 유전체 데이터 사업화에 성공한 곳이죠. 또 우리나라와 같이 공공보험 체제이기도 하고, Genomics England는 우리나라의 KT&G와 같은 공기업이거든요. 아이들 대상으로 무상으로 유전체 시퀀스 분석을 제공해 공공보험 체제에서 국가 주도로 유전체 분석을 하고 있고요. 이렇게 축적된 10만명 유전체 분석 데이터를 제약사, 연구소, 국가를 상대로 팔아 수익을 내고 있어요.”

-제약사도 이번 학회에 많이 참여했다고 하는데, 글로벌 제약사는 신약개발에 유전체 데이터를 어떤 방식으로 활용하고 있나요?

“규모가 큰 글로벌 제약사는 자체 유전자 연구소를 갖고 있습니다. 대표적으로 사노피, 화이자, 리제네론은 내부적으로 유전자센터를 설립해 후보물질 도출부터, 임상설계까지 다양하게 유전체 정보를 활용하고 있어요. 중소 기업은 팀 단위로 꾸리기도 하고, 최소한 개발팀에 바이오마커를 찾는 유전체 전문인력을 내부 1-2명은 두고 있습니다.”

-국내 업체들은 유전체 데이터 활용을 어떻게 보고 있나요?

“필요하다는 것은 알지만, 어떻게 해야 할 지 모르는 것 같습니다. 특히 규모가 작은 바이오벤처가 내부적으로 유전체 전문인력을 두기도 어려울 거고요.”

테라젠, 유전체 기반 신약개발 협력자로

-국내 제약바이오 업계가 유전체 기반 신약개발을 필요로 할 때, 테라젠이텍스는 어떤 서비스를 제공해 줄 수 있을까요?

"이런 경험을 통해 자연스럽게 신약개발에 필요한 데이터가 무엇인지 인공지능이 아닌 우리 동료들의 natural neural networks(자연신경망)을 통해 직관적으로 수행 하게 됐죠.(웃음)"

-실제로 유전체 데이터를 신약개발에 활용한 사례가 있나요?

“자회사 메드펙토가 개발하는 항암제 백토서팁과 루게릭병 치료제 개발에 저희가 분석한 데이터를 활용하고 있어요. 저희 바이오연구소 내부에 딥오믹스 팀을 꾸려, 신약재창출, 신약개발, 바이오마커 발굴에 유전체 데이터를 활용하려고 합니다.”

-다른 외부 기업과 협업한 사례는 있나요?

“외부 제약사와도 최근 활발히 협업하고 있습니다. 향후 유전체 데이터를 활용해 신약개발 주기를 앞당긴다는 근거 확보를 위해 노력 중입니다.”

-앞서 ASHG 학회에서 보면 우리나라는 유전체 데이터를 신약개발에 활용하는 데 한계가 있을 것 같은데요. 글로벌 시장에서 한국과 테라젠의 경쟁력이 있을까요?

“서울의 임상 인프라가 훌륭합니다. 다만 안타까운 것은 임상연구 침상(Bed)만 제공하고, 여기에 축적된 임상데이터는 모두 글로벌제약사만 소유하는 구조입니다. 저희의 최종 목표는 우리나라에서 진행되는 질 좋은 임상데이터를 소유하고 분석할 수 있는 기반을 만드는 것입니다.

이를 위해 현재 국내 대학병원 연구진과 작업을 하고 있는데요. 우리가 중앙연구소 역할을 하면서, 글로벌 제약사와 함께 임상시험을 수행하는 모델을 만들고자 합니다.”

테라젠이텍스 바이오연구소 딥오믹스(DEEP OMICS)는?

대규모의 오믹스 빅데이터를 보유한 곳이다. 인공지능 기반의 유전체 빅데이터 분석, 유전체 빅데이터 기반 신약 임상연구, 이미지/의료정보/오믹스 빅데이터 통합 분석 등을 수행한다. 빅데이터 분석 및 컨설팅 전문가를 다수 보유하고 있다.

인공지능 기술은 오믹스 데이터를 활용해 데이터에서 의미있는 패턴을 발견하고 알고리즘화를 통해 암 치료 방법, 치료법 반응 환자 분류를 가능하게 한다. 

또 이미지 데이터를 이용한 맞춤형 인공지능 솔루션을 개발하고 서비스하고 있다. 또한 클라우드 기반의 빅데이터 컨설팅 서비스도 제공한다.

저작권자 © 히트뉴스 무단전재 및 재배포 금지