한남식 밀너연구소 인공지능연구센터장

한남식 센터장 

제약바이오협회, 한영 생명과학 심포지엄

“컴퓨터 과학자로서 진정한 의미의 인공지능(AI)은 아직 없다고 본다. 현재 논의되고 있는 인공지능은 확률을 빨리 계산하는 정도다. 그러나 (현재의 기술로도) 인공지능은 신약개발에 유용한 도구 역할을 할 수 있다.”

한남식 캠브릿지 의과대학 밀너연구소 AI연구센터장은 한국제약바이오협회가 주최로 16일 인터콘티넨탈 코엑스에서 열린 한영 생명과학 심포지엄에서 이같이 말했다.

히트뉴스는 한 연구센터장의 발표내용을 토대로 영국의 인공지능 신약개발 모습을 전한다.

◆산학연 집합체 밀러 컨소시엄… GSK, 화이자와 연계한 인공지능 연구

800년 넘은 영국의 캠브릿지 대학에는 의생명과학을 위해 모인 글로벌 제약사 연구소, 대학 연구소, 병원이 모인 ‘캠브브릿지 바이오메디컬 캠퍼스’가 있다. 여기에 인공지능 신약개발을 위해 모인 ‘밀러 연구소’에는 유전학 연구에 한 획을 그은 캠브릿지 대학, 생어 연구소와 화이자, 존슨앤존스, GSK, 아스트라제네카를 비롯한 글로벌 제약사와 암젠 등의 바이오텍이 있다. 여기에 한국의 삼성서울병원의 유전체센터, 한국전자통신연구원도 속해 있다.

특히 바이오메디컬 캠퍼스는 밀러 연구소와 함께 5000명의 연구인력이 있는 아스트라제네카 연구원과 심혈관질환을 다루는 대학병원이 있다. 또 기초과학의 상징인 노벨상을 받은 연구원들이 각 층에 일하고 있는 기초과학 연구소가 있다. 여기에 인공지능 신약개발을 맡고 있는 밀러 연구소는 딥러닝과 머신러닝을 포함한 인공지능을 이용해 데이터 분석을 한다. 이렇게 분석된 데이터를 바탕으로 새롭거나 뛰어난 약물을 개발하는 데 활용한다.

그는 “헬스케어 분야에서 인공지능을 활용할 수 있는 부분은 신약개발 과정”이라며 “약 8%의 성공률 정도 밖에 안되는 신약개발의 성공률을 올리는 데 인공지능은 큰 역할을 할 것”이라고 했다.

◆신약개발 실패원인 50% 유효성, 25% 부작용 이슈

신약개발의 실패원인을 살펴보면, 효능의 문제가 50%, 부작용 문제가 25%다. 다시 말해 신약개발 실패원인의 70% 이상이 과학적 이유이고, 이는 인공지능을 활용해 개선할 여지가 있다.

그렇다면 왜 신약에서 효능이 제대로 나타나지 않고, 부작용이 발생하는 것일까? 이는 특정 질병과 연관된 타깃이 정립되지 않았기 때문이다. 여기서 말하는 타깃이란 몸 속의 유전자, 특정 단백질 등을 의미한다. 질병과 연관된 타깃이 정립되지 않았다는 것의 의미는 이렇다. 질병에 영향을 끼치는 특정 단백질과 유전자가 제대로 매칭되지 못해 약물개발에 어려움을 겪는다는 것이다.

그는 “모든 질병을 연구하다 보면, 결국 종착지는 유전자다. (약물을 이용해) 이 유전자를 어떻게 발현시키고, 억제할지가 관건”이라며 “이러한 유전체 데이터를 인공지능에 학습시켜 신약개발 효율을 높일 수 있다”고 했다.

이어 “실제로 인공지능을 통해서 신약개발의 효능과 질병의 원인 간의 연관성이 명확해 졌다”며 “이러한 움직임은 학계에서 주도하지만, 이런 요청은 GSK 등을 중심으로 산업계에서 먼저 요청했다”고 했다.

◆생물학 데이터, 아직 빅데이터 수준 아냐

밀러 연구소가 신약개발에 인공지능을 활용하기 위해 하는 일은 ▲인공지능 학습 데이터 축적 ▲데이터 실험 ▲기존 데이터 통합이다.

그는 “아직까지 우리가 하는 분야는 물리학 등 다른 분야와 비교해 빅데이터는 아니다”며 “충분한 양의 데이터를 확보하기 위해 데이터 통합(integration) 및 실험데이터의 편향 등을 제거한 정규화(normalization)가 필요하다”고 했다.

그가 인공지능을 신약개발에 활용하는 방식은 이렇다. 특정 암 종과 연관된 유전자(gene)를 164개 찾았다고 하자. 이 유전자들을 연결할 수 있는 경우의 수는 어마어마 할 것이다. 인간의 계산 능력으로는 이 경우의 수를 모두 알 수 없다. 이 때 인공지능을 활용해 각 유전자 간의 네트워크를 분석해서, 단백질 상호작용을 알아낸다. 이는 신약개발에 활용할 수 있는 유용한 정보다.

그는 “현재는 일본의 다케다제약과 사노피까지 함께 모여 산업계 펀딩을 통해 생어 연구소 데이터를 바탕으로 인공지능에 들어갈 데이터 베이스를 늘리는 데 주력하고 있다”고 했다. 

저작권자 © 히트뉴스 무단전재 및 재배포 금지