"AI 신약개발 중요하지만 국내 빅데이터만으론 제한적"
"AI 신약개발 중요하지만 국내 빅데이터만으론 제한적"
  • 김경애
  • 승인 2019.08.28 06:07
이 기사를 공유합니다

데일리팜 포럼서 국내 AI 신약개발 현주소 진단
"양질의 데이터 확보는 AI 신약개발 성공의 키"

"우리나라에 있는 빅데이터만으로는 제대로 된 신약 개발을 할 수 없다"

일동제약 중앙연구소 MC팀 권진선 박사는 27일 aT센터에서 열린 '제36차 데일리팜 제약바이오산업 미래포럼'에서 이 같이 밝혔다. 

'우리나라 AI 신약개발 현주소와 미래 전략' 주제로 개최된 이날 포럼에는 권진선 일동제약 중앙연구소 MC팀 박사·대웅제약 김일환 인공지능개발팀장·한미약품 연구센터 최창주 R&D정보관리팀장·SK바이오팜 디지털헬스케어TF팀 오경석 박사가 패널로 참여했다.

권 박사는 "우리나라가 보유한 데이터, 특히 보건데이터의 경우 믿을 수 없다는 얘기가 많이 나온다. 실제로 우리나라에 존재하는 데이터만으로는 제대로 된 신약 개발이 어렵다. 일단은 국내에 있는 데이터들을 모아야 하지만, 데이터들이 없어서 우리나라가 신약개발을 못 한다는 얘기는 없어야 한다"고 했다. 

이어 "인공지능 빅데이터는 많으면 많을수록 좋다. 다른 나라에는 제대로 된 빅데이터가 굉장히 많이 있다. 이들 데이터를 받아들여서 신약 개발을 진행하는 게 우선"이라고 했다. 

'제36차 데일리팜 제약바이오산업 미래포럼'이 '우리나라 AI 신약개발 현주소와 미래 전략' 주제로 27일 오후 2시 양재동 aT센터 4층 창조룸에서 개최됐다.
'제36차 데일리팜 제약바이오산업 미래포럼'이 '우리나라 AI 신약개발 현주소와 미래 전략' 주제로 27일 오후 2시 양재동 aT센터 4층 창조룸에서 개최됐다.

데이터가 정확하지 않다면, 알고리즘도 쓸모 없다

신약 개발에서 AI가 왜 필요할까? 바로 시간·비용을 절감하기 위해서다. 신약 개발에는 대개 15년 이상의 기간과 3조원 가량의 비용이 소요되지만, 임상 1상부터 FDA 승인을 통과하는 신약 성공률은 평균 9.6%에 불과하다. 상당한 시간·비용을 투자해도 결국 10개의 신약 후보물질 중 단 1개의 물질만 신약으로 승인된다.

김일환 대웅제약 인공지능개발팀장
김일환 대웅제약 인공지능개발팀장

김일환 대웅제약 인공지능개발팀장은 "신약 연구개발비는 점차 늘어나는데, 임상에서만 최소 3000억원의 비용이 투입된다. 그러나 전임상·임상시험은 규제 과학이기 때문에 제약사가 컨트롤할 수 있는 부분은 상당히 적다. 이 때문에 최근 신약 후보물질 발굴 단계에서 인공지능 활용 시도가 증가하고 있다"고 설명했다.

인공지능은 기계가 인간의 지각·학습·추론 능력을 모방하는 기술로 정의된다. 국내에서는 머신러닝·딥러닝으로 표현되는데, 이 기술은 사실 1950년대부터 존재해왔다. 빅데이터가 쌓이고 컴퓨팅(Computing) 파워가 증가하면서 기술 발전을 거듭했고, 신약개발 효율성 강화와 최적화를 위한 도구까지 도달했다. 

김 팀장은 "신약개발 전주기에서 인공지능이 사용된다고 하지만, AI가 신약을 만드는 건 아니다. AI는 문제 해결을 위한 도구로, 문제 해결을 위해 데이터를 만들고 모델링하는 과정에서 활용된다"면서, "인공지능은 데이터가 중요하다. 무엇보다도 재현성이 있고 신뢰할 수 있는 데이터 확보를 강조하고 싶다"고 했다.

2015년 아토마이즈를 시작으로 한 AI 업체는 2017년부터 2018년까지 1년간 2배로 증가했다. 업체가 늘어난만큼 투자자들도 상당수 늘어났다. 제약사·AI 업체간 콜라보레이션도 최근 활발히 진행되고 있다. 올해 2분기 아스트라제네카는 영국 '베네볼런트AI', 사노피는 '구글'과 손을 잡았다.

전세계에서 AI 신약개발을 위한 개방형 혁신은 실제 많이 일어나는 추세다. 2017년 일본은 정부 주도로 AI를 활용한 신약 개발 컨소시엄 LINC(Life Intelligence Consortium)를 구성했으며, 미국·중국도 정부 주도 하에 AI업체·벤처캐피털 등과 컨소시엄을 형성했다. 

국내에서도 제약사와 AI스타트업간 공동연구가 진행되고 있다. 최근 SK케미칼과 스탠다임은 신약 개발을 위한 공동 연구 계약을 체결했으며, 올해 3월 개소한 인공지능 신약개발지원센터는 여러 기관과 협약을 맺어 데이터 확보에 상당한 노력을 기울이고 있다. 

김 팀장은 "올해는 우리나라가 AI를 통해 신약개발을 시작한 원년이라고 생각한다. 그러나 국내 헬스케어 데이터는 글로벌 제약사와는 좀 다른 생태계로, 공유가 어려운 게 현실이다. 이 가운데 국내 제약사가 어떻게 글로벌 국가를 쫓아갈 것인지 우리는 지속적으로 고민해야 한다"고 했다.

AI솔루션이 있어도 내부에 팀을 구축하고 오픈된 소스를 검증해 고도화할 수 있는 인력은 부족한 실정이다. 김 팀장은 AI 신약개발 성공 키포인트로 사람, 데이터, 알고리즘을 제시했다. 

김 팀장은 "상위 15개 글로벌 제약사에서 2015년 이후 AI를 접목해 신약 개발을 시도하니 수익률이 개선됐다는 리포트가 있다. 이 리포트에서는 AI를 가장 잘 아는 리더와 AI·BT 연결이 가능한 리더, AI에 친숙한 CEO, 조직 문화 등이 신약 개발을 뒷받침한 결과, 수익률 개선이 가능했다고 보고했다"면서, "무엇보다도 데이터가 부정확하면 알고리즘도 쓸모 없다. 그만큼 데이터가 중요하다"고 강조했다.

신약개발을 위한 효율적인 도구로서 AI에 접근할 필요가 있다고 했다. 김 팀장은 "협업 가능한 부분들을 정부와 함께 만들어가야 한다. 이를 위해서는 데이터 사이언티스트와 각 분야 전문가의 1:1 매칭을 통한 다학제간 협업이 필요하다. 관계자들이 다같이 고민하는 오픈 이노베이션의 시간이 많아졌으면 한다"고 했다. 

AI 신약개발 성공 핵심은 '양질의 데이터 확보'

AI 신약개발은 국내에서는 걸음마 단계이지만, 임상 데이터 질 검증, 전임상 동물시험, 전임상 데이터 분석을 통한 바이오마커 발굴, 빅데이터 분석을 통한 타겟 발굴, 신약 후보물질 도출 등 이미 상당한 분야에서 적재적소에 활용되고 있다. 

최창주 한미약품 연구센터 R&D정보관리팀장
최창주 한미약품 연구센터 R&D정보관리팀장

최창주 한미약품 연구센터 R&D정보관리팀장은 "AI 활용은 연구개발 프로세스를 최적화하고 개발을 가속화해 신약개발 비용·시간을 절감시킨다. AI 활용은 앞으로 점점 늘어날 것"이라고 했다.

제약사가 임상 데이터를 식약처에 제출하면, 해당 데이터의 신뢰성·무결성을 가장 먼저 확인하게 된다. 만일 데이터 양이 적으면 일일이 확인할 수 있지만, 방대한 경우 확인이 어렵다. 이 때 통계 분석에서 간과될 수 있는 임상데이터 오류·이상치를 머신러닝을 활용해 식별할 수 있다. AI로 임상 데이터의 복잡한 오류를 확인해 무결성·품질을 제고한다. 

동물시험에서도 마찬가지다. 기존에는 동물 행동을 분석하는 데 사람이 일일이 지켜보면서 1점부터 5점까지 점수를 매겨왔다. 최 팀장은 "사람이 하는게 가장 정확하다고 주장하는 이들이 여전히 있지만, 한 사람이 아닌 여러 사람이 해석할 경우 편향(Bias)이 발생할 수 밖에 없다. 또, 사람이 하게 되면 밥 먹을 시간도 없이 지켜봐야 한다. 그건 한계가 있다. AI를 활용하면 24시간 계속 관찰해 평가할 수 있다"고 했다.

전임상 단계에서는 AI를 통한 경쟁 물질과의 염기서열 비교 분석을 통해 차별화 전략 가능성을 확보할 수 있다. 이는 차별화·바이오마커 가능성을 예측하고, 약효 예측 및 발굴 바이오마커 확인을 통해 임상 성공률을 제고하는 전략이다. 

공개 데이터를 활용해 타겟을 검토·발굴할 수도 있다. 자연어 처리기술을 활용해 정형·비정형 데이터를 기계에 학습시키면, 타겟 검토와 후보물질 관련 연구 동향 분석에 활용할 수 있다. 

IBM가 신약개발을 위해 개발한 '왓슨 포 드럭 디스커버리'(Watson for Drug Discovery)는 비구조화된 각종 데이터를 분석하고 이들의 연관관계를 파악하는 AI 툴로, 약물·유전자·질환의 연관관계를 발굴하는데 사용됐다. 

최 팀장은 "올해 IBM이 왓슨 포 드럭 디스커버리(Watson for Drug Discovery)를 더 이상 팔지 않겠다고 선언했는데 당시 '인공지능 활용이 바람직하지 않나?' 'AI 활용은 올바른 방법이 아닌가'라는 지적이 제기됐었다. 내가 알기로는 왓슨의 자연어 처리기술이 부족한게 아닌, 데이터 소스에서 문제가 있었다. 의학저널 소스는 저작권 문제로 다 막혀있으며, 표·그래프 해석은 한계가 있어 빛을 보지 못한 게 아닌가 싶다"고 했다.

약물·질환·유전자 간 연관관계를 보는 게 의미없는 일이 아니라고 했다. 실제 한국제약바이오협회 산하 인공지능신약개발지원센터에서도 약물·질환·유전자 간 관계를 자연어 방식이 아닌, 기존 데이터베이스를 활용해 분석하는 연구를 진행하고 있다. 

한미약품은 올해 말까지 인공지능신약개발지원센터·AI업체와 '인공지능 신약개발 시범사업'을 진행하고 있다. 이 사업은 자체 AI 활용 신약개발 기반 모델 구축을 목표로, IT·BT간 선진 협업개발 모델을 구축하고, 신규 의약품 후보물질 도출 가능성을 검증한다. 

최 팀장은 "인공지능 기술 발전에 따른 변화·대응 방안 마련이 필요하다. 적어도 AI가 어떤 개념인지는 이해해야 한다. 그래야만 활용 시 갭이 줄어든다"면서, "단기적으로는 AI 활용 스킬을 개발하고, 장기적으로는 AI가 대체할 수 없는 인간 고유 영역에 대한 전문성 개발이 필요하다. 데이터 독점 회사들로부터 기인한 양극화를 어떻게 해소할지도 주요 과제인데, 무엇보다도 양질의 데이터 확보가 가장 중요하다"고 했다.

한미약품에서는 AI 시대를 대비한 데이터 고도화를 추진하고 있다. 연구노트를 디지털화하고, 가공하지 않은 로 데이터(Raw Data)의 무결성을 보증하기 위한 시스템을 구축 중이다. 순차적으로는 화합물 은행 자료 고도화 등을 계획하고 있다. 

최 팀장은 "좋은 알고리즘이 나온다면, 그걸 가진 회사와 협업해 적용해서 바꾸면 된다. 그런데 데이터가 없으면 아무 것도 할 수 없다. 공개된 데이터만 활용 가능한 수준이다. 경쟁력을 갖추려면 먼저 올바른 데이터를 선정해야 한다. 이후 적절한 알고리즘을 매칭시키는 데이터 사이언스가 인공지능 신약개발의 성공 핵심"이라고 했다.

알고리즘 구축보다 자체 데이터 통합·표준화 작업 우선돼야 

AI 헬스케어 시장에서 신약개발 분야는 급속히 성장할 것으로 전망되는데, 이 가운데 AI 기반 신약개발을 위한 글로벌 협력 구조가 공고히 형성되고 있다. 글로벌 제약사들은 AI업체와 플랫폼 제공업체와 손을 잡고 파트너십을 통해 신약개발을 활발히 진행 중이다. 

일동제약 중앙연구소 MC팀 권진선 박사
일동제약 중앙연구소 MC팀 권진선 박사

일동제약 중앙연구소 MC팀 권진선 박사는 "지난해에는 빅파마와 AI업체간 협력으로 신약개발이 진행됐는데, 최근 벤처캐피탈에서 굉장히 많은 투자가 진행되고 있다. 영국 '베네볼런트AI'의 경우 작년 한해에만 1억1500만불의 투자를 받았다. 이는 우리나라 과기부에서 제공하는 것보다 훨씬 많은 수치"라고 했다. 

권 박사는 "내년도 말에는 AI를 활용한 신약개발이 성공적으로 이뤄질 것으로 전망된다. 이렇게 되면 지금의 자본금보다 5~10배정도 증가한 펀딩이 이뤄질 것으로 보인다. 벤처캐피탈은 손해보는 투자를 절대 하지 않는다. 전세계적으로 이렇게 투자가 활발히 진행된다는 것은 AI를 활용한 신약개발이 결코 허황된 얘기가 아니라는 것을 방증하는 것"이라고 했다.

한 가지 주목할 점은 제약사와 AI업체 모두 내부 인프라를 자체적으로 구축하려는 움직임이 보인다는 것이다. AI업체들은 자체적인 파이프라인을 가지려 하며, 제약사들은 AI 알고리즘을 도입해 기능을 확장하고 있다.

권 박사는 "AI 신약개발에서 가장 중요한 건 데이터 확보다. 현 시점에서 제약사가 내세울 부분은 빅데이터 구축이므로, 많은 회사에서 디지털 전환이 활발히 진행되고 있다"면서, "양질의 데이터를 확보하는 것이 AI 신약개발 성공의 지름길이 될 것 같다. 빅파마들은 IT업계와 협업을 맺어 여러 데이터를 모으는 작업을 진행하고 있다"고 했다.

전세계 이슈는 AI '인재' 부족이다. 국내 AI 인재는 밖으로 많이 빠져나가는 실정이다. 이 때문에 AI 인재 확충을 위해 대학 등 여러 기관에서 먼저 인재를 양성할 필요성이 많이 제기되고 있다. 또 다른 이슈는 기존에는 정부가 아닌 빅파마 주도로 AI 신약개발이 진행됐는데, 최근 일본·미국·EU·중국 등에서 정부 주도로 개발이 이뤄지는 것이다.  

아울러 중국 활동이 급격히 증가하고 있다. 중국 정부는 AI 신약개발에서 2030년도에 선두가 되겠다는 비전을 가지고 사업을 진행하고 있다. 이에 대한 투자는 미국의 10배가 넘는다. 중국 IT기업은 자국 AI업체에 투자·인수하고, 우시앱텍(Wuxi AppTec)이라는 중국 기업은 펀딩을 만들어 미국 인실리코 메디슨(Insilico Medicine) 사에 투자했다. 반대로 구글·세쿼이아(Sequoia)는 중국 AI스타트업 '엑스탈피'(XtalPi)에 1500만 달러를 투자하기도 했다. 

권 박사는 "중국 활동을 눈여겨볼 필요가 있다. 중국은 개인정보보호법이 상대적으로 유연하다는 장점이 있다. 만일 10억 인구에 대한 실시간 데이터가 생성된다면 다른 나라보다 훨씬 앞으로 나아가게 될 것이다. 다른 나라에서 고도로 훈련된 중국인들이 귀국해 자국 발전을 위해 노력하는 흐름도 보인다"고 했다.

2018년이 양적으로 팽창된 해였다면, 올해는 검증을 통해 질적 향상으로 나아가는 해가 될 것이라고 했다. 권 박사는 "올해 AI 신약개발 실패사례가 나오면 이 같은 추세가 한풀 꺾이지 않을까 싶은 생각도 든다. 그러나 투자는 여전히 활발히 이뤄지며, 많은 회사에서 AI 신약개발 연구를 진행하고 있다. 이제는 신약개발에서 AI가 정말 필수적인 도구가 아닐까 생각된다"고 했다.

국내 제약사와 AI업체 협업 연구 현황을 보면, 스탠다임이 크리스탈지노믹스·아주대·카이스트와 항암제·파킨슨병 치료제·자폐증 치료제 개발을 위해 협업하고 있고, 일동제약은 심플렉스와 함께 AI를 활용한 신약개발 연구와 면역항암제 개발을 위한 공동 연구를 진행하고 있다. 

권 박사는 "AI를 활용하면 50% 이상의 약효 유효물질을 발굴할 수 있다고 들었는데, 지금은 그게 거짓말이 아닐 것 같다는 생각이 들었다. 다른 기관들도 활발한 협력을 진행하는 것으로 안다"면서, "결과적으로 가장 중요한 건 AI 알고리즘의 구축이 아닌, 빅데이터 통합·표준화 작업이다. 각 기관이 자체적으로 보유한 인하우스 데이터들을 먼저 통합·표준화하는 작업이 굉장히 중요하다"고 했다.

민간·정부·학계 협력 구조 시스템이 신약개발 가속화의 중심이라고 했다. 권 박사는 "정부뿐 아니라 정부출연연구기관, 대학 등의 기관이 활발한 협업을 진행해야만 시너지가 발생한다. 제약바이오업체와 AI업체만 파트너십을 맺으면 결국 한계는 올 수밖에 없다. 정부 예산이 많이 지원돼 활발한 AI 신약개발 사업이 진행된다면 IT 강국인 우리나라의 제약바이오산업 미래가 바뀔 수 있다"고 했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.