"AI 활용 신약개발, 데이터 '개방-공유' 관점에서 접근"
"AI 활용 신약개발, 데이터 '개방-공유' 관점에서 접근"
  • 홍숙
  • 승인 2018.10.16 06:00
이 기사를 공유합니다

‘AI Pharma Korea Conference’를 통해 본 인공지능 신약개발의 현재
‘AI Pharma Korea Conference 2018’이 15일 서울 코엑스에 개최됐다.
‘AI Pharma Korea Conference 2018’이 15일 서울 코엑스에 개최됐다.

빅데이터를 신약개발에 활용하기 위해선 데이터 공유가 우선이고, 공유된 데이터를 인공지능에 학습시키면 신약개발 주기를 앞당길 수 있다는 것 AI Pharma Korea Conference의 핵심 내용이다.

‘AI Pharma Korea Conference 2018’이 15일 서울 코엑스에 개최됐다. 이날 행사는 인공지능 신약개발의 관심을 반영하듯 약 800여명의 참석자가 행사장을 가득 메웠다. 히트뉴스는 이날 기자간담회와 컨퍼런스 발표 내용을 토대로 신약개발에서 인공지능이 어떻게 활용되고, 현재 어느 단계까지 활용이 가능하지 짚어봤다.

◆공공데이터 학습→제약회사 신약개발 데이터로 학습범위 확대=병원의 전자의무기록(EMR), 유전체 데이터, 임상시험 데이터, 논문 데이터, 각종 약물 관련 데이터 등. 바야흐로 제약업계 데이터의 물리적인 양은 폭발적으로 증가하고 있다. 그러나 덩치만 불린 데이터는 그 자체로 신약개발에 이용될 수 없다.

이노플렉서스 건잔바르 대표 등.
이노플렉서스 건잔바르 대표 등.

이미 개방된 공공 데이터 활용이 우선이다. 우리나라보다 데이터 공유에 필요성을 느낀 미국과 유럽은 이미 공공 데이터 베이스 구축한 상태다. 대표적인 공공 데이터 베이스로는 미국 NIH의 NCI60와 영국의 Sanger 연구소의 GDSC가 있다. 우리나라 역시 이러한 흐름에 맞춰 과학기술정보통신부 등을 중심으로 공공 데이터를 활용하기 위한 플랫폼 구축 사업을 진행 중이다. 일단 인공지능 초기 모델은 비교적 자유롭게 활용할 수 있는 공공 데이터를 학습시키는 것이 우선이다.

인공지능에 공공 데이터만 학습시키면 될까? 쉽게 말해, 인공지능으로부터 신약개발을 위한 더 정교한 답을 얻고 싶으면, 공공 데이터만으론 부족하다. 제약사들이 꽁꽁 싸두고, 공개하길 꺼려하는 각종 신약개발 연구 데이터를 학습시키는 것이 관건이다. 이날 컨퍼런스에 참석한 연자들은 한 목소리로 제약사들의 데이터에 대한 태도 변화를 주문했다.

이노플렉서스(Innoplexus)의 건잔바르(Gunjan Bhardwaj) 대표는 “업계는 실질적인 데이터 개방에 나서야 한다. 특히, 실패한 신약개발 경험을 공유함으로써, 다른 연구소에서 실패를 반복하지 않도록 해야 한다”며 “이러한 데이터 공유를 위해선 블록체인 기술이 한 방안이 될 수 있다”고 주장했다.

블록체인을 이용한 데이터 공유와 관련해 이은솔 메디블록 대표는 히트뉴스와의 전화통화를 통해 “블록체인 기술을 활용해 환자 데이터를 공유하면, 스마트폰을 통해 데이터 공유할 수 있을 뿐만 아니라, 해당 데이터의 ‘신뢰성’과 ‘무결성’을 증명할 수 있는 흐름(flow)를 만들 수 있다고 답했다.

송상옥 스탠타임 CTO.
송상옥 스탠타임 CTO.

◆인공지능을 통해 신약개발의 어떤 부분을 풀고 싶은가=송상옥 스탠다임 CTO는 “현재 인공지능 기술을 냉정히 진단하면, 신약개발 분야에서 ‘정답’을 말해주는 도구(tool)는 아니다”며 “신약개발과 관련해 어떤 문제를 풀고 싶은지 인간과 인공지능 간의 소통(communication)이 중요하다”고 강조했다.

그는 “특히, 우리나라 제약사는 내부에 컴퓨터를 전공한 전문가가 부족하다 보니, 인공지능 신약개발에 대한 이해도도 역시 낮은 실정”이라며 “인공지능을 활용해 효과적인 신약관련 답변을 얻으려면, 명확한 신약개발 목표가 있어야 한다”고 했다. 양현진 신테카바이오 박사 역시 “신약개발에 대한 목표가 구체적일수록, 인공지능을 통한 신약개발의 효율성을 더욱 증대될 것”이라고 했다.

◆신약 재창출부터 후보물질 발굴까지=인공지능에 학습시키는 데이터, 알고리즘은 모두 다르지만, 결국 이들이 이루고자 하는 최종 목표는 크게 신약 재창출과 신약후보물질 발굴이다.

구체적으로 살펴보면, IBM의 인공지능 플랫폼 ‘왓슨 포 드러그 디스커버리(Watson for drug discovery)’는 방대한 논문 데이터를 바탕으로 신약개발을 위한 정보를 연구자에게 제공해 준다.

IBM왓슨헬스 파스칼 상페 인지솔루션 전문가.
IBM왓슨헬스 파스칼 상페.

파스칼 상페(Pascal Sempe) IBM 왓슨 헬스 인지솔루션 전문가는 “왓슨 포 디스커버리를 활용하면 방대한 논문 데이터를 바탕으로 기존에 정보를 찾아내는 것에 한 단계 더 나아가, (신약개발을 위한) 가설을 세울 수 있다”며 “특히 왓슨 포 디스커버리는 유전자와 단백질 변이에 대한 이해도가 높은 인공지능 플랫폼”이라고 했다. 이어 그는 “왓슨 포 디스커버리 플랫폼을 활용하면, 신약개발과 관련된 타겟 물질 파악, 질병관련 유전자와 질병의 기전 이해 등을 알 수 있다”며 “아직 문헌에는 존재하지 않는 특정 물질과 질환의 연결고리까지 예측해 준다”고 설명했다.

실제로 왓슨 포 디스커버리는 발암단백질을 억제할 수 있는 새로운 효소 단백질(kinase)과 근위축성측색경화증(루게릭병) 관련 RNA 단백질를 찾아냈다.

◆인공지능이 유용하다는 점, 입증해가는 과정=이번 컨퍼런스에서 발표된 내용을 살펴보면, 아직까지 인공지능 기술을 활용해 도출된 신약 후보물질은 전임상 단계에 머물러 있다. 즉, 인공지능을 통해 도출된 후보물질이 약물로 시장에 나온 사례는 없다.

송 CTO는 “현재 AI가 정말 신약개발을 촉진하는지에 대한 실질적인 근거가 필요한 시점”이라며 “실제로 최근 몇 년간 여러 가지 실험 등이 인공지능이 신약개발을 위한 유용한 도구라는 것을 입증해 나가고 있는 과정”이라고 진단했다. 양 박사 역시 “결국 인공지능은 방대한 양의 데이터를 학습해야 정확한 예측을 할 수 있다”며 “현재 확보할 수 있는 데이터에는 한계가 있기 때문에 인공지능 활용한 신약개발 역시 장기 프로젝트로 생각해야 한다”고 했다.

개방과 공유. 이날 컨퍼런스에 참여한 연자들이 한 목소리로 강조한 단어다. 결국 신약개발에 참여하는 학계, 기업, 의료계 모두가 자신이 가진 데이터를 개방하고 공유해야, 신약개발을 위한 정교한 인공지능이 만들어질 수 있다는 것이다. 인공지능 기반 신약개발의 관건은 기술의 발전이 아니라, 연구자들의 태도에 있다는 것이 인공지능 신약개발 기업 책임자들의 공통된 의견이었다.

‘AI Pharma Korea Conference 2018’ 현장.
‘AI Pharma Korea Conference 2018’ 현장.

 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.