메디데이터코리아 에이콘AI 솔루션 컨설턴트 김나현 박사

디지털 뉴딜 등 AI와 빅데이터 지원 정책, 제약·바이오 산업의 활용방안을 모색하는 포럼이나 세미나 등을 취재하며 들었던 가장 큰 궁금증은 'AI·빅데이터가 현장에서 어떻게 쓰이는가'라는 데에 있었습니다.

고도화된 AI와 풍부한 데이터가 실제 현장에서 어떤 역할을 해 줄 수 있는지에 대한 고민은 해본 적 없었습니다. 그저 'AI는 고도화되면 될 수록 좋을 것이다', '데이터는 많으면 많을 수록 좋을 것이다'라는 막연한 생각만 갖고 있었을 뿐입니다.

그러던 중, 지난달 20일 글로벌 임상 데이터 플랫폼 개발사 메디데이터의 미디어데이를 통해 AI와 빅데이터에 대한 대략적인 모습을 발견할 수 있었습니다. 

그에 따라 메디데이터코리아 에이콘 AI(AcornAI) 솔루션 컨설턴트 김나현 박사와 만나 '눈으로 볼 수 있는 임상현장 AI'에 대한 이야기를 좀 더 들어봐야겠다는 생각이 들었습니다.

히트뉴스는 김나현 박사와 인터뷰를 통해 AI와 빅데이터가 임상현장에서 어떤 역할을 할 수 있는지, 또 어떤 역할을 하고 있는지 들어봤습니다.

메디데이터코리아 에이콘AI(Acorn AI) 솔루션 컨설턴트 김나현 박사
메디데이터코리아 에이콘AI(Acorn AI) 솔루션 컨설턴트 김나현 박사

 

신약개발에서 AI는 어떤 데이터를 활용하는 거죠?

"신약 개발에 데이터를 활용한다고 할 때, 고객들이 원하는 것이 다르기 때문에 니즈에 따라 구성하고 있습니다. 메디데이터와 에이콘 AI에서는 임상시험 데이터, 실사용데이터 두 가지를 활용합니다. 임상 데이터의 경우, 메디데이터의 전자자료수집시스템(EDC)를 통해 수집한 데이터베이스에서 추출합니다. 중요한 것은 실사용 데이터는 전자의무기록(EMR) 등 여러 곳에서 가져온 데이터로 그 자체로는 연구 목적으로 쓰일 수 없다는 것입니다. 가공이 중요하다는 의미입니다."

 

데이터를 가공한다는 것은 어떤 의미인가요?

"불필요한 데이터, 즉 불순물을 제거하고 표준화를 하는 과정입니다."

 

불순물 제거와 표준화는 어떻게 해요?

"예를 들어 데이터에 포함된 이름이 동일한 뜻을 의미하더라도 표기는 다 다를 수 있습니다. 여자, 여성, 여(女) 처럼요. 이런 단어들을 일치화 시키는 것이 첫 과정인 표준화 입니다.

다음은 잘못된 데이터의 삭제 혹은 재확인 등입니다. 예를 들어 혈압 데이터의 경우 1000이라는 수치는 잘못된 데이터 입니다. 재확인을 통해 수치를 수정하거나 삭제하는 작업 등이 이뤄집니다"

 

불순물 제거와 표준화를 거친 빅데이터는 어떻게 활용되죠?

"데이터의 숫자가 많다는 것은 접근방식을 얼마나 다각도에서 할 수 있는가를 결정하기도 합니다. 한 문제점을 연구함에 있어 단편적으로 하나의 변수만을 분석하는 것이 아닌 다각도에서 확인할 수 있다는 것입니다.

다시 고혈압으로 예를 들어보겠습니다. 단편적 변수는 소금의 섭취량 등 식습관 정도를 생각할 수 있겠습니다. 그렇지만 다양한 데이터를 확보했을 경우 환자의 △운동량 △스트레스 지수 △환자 거주지와 의료기관 사이의 거리 등을 통해 전체적으로 고혈압에 미치는 영향을 깊게 파악할 수 있습니다."

김나현 박사는 메디데이터에 합류하기 전 한국아이큐비아에서 의료 기기 및 후기 약물 연구를 담당하는 한국 혁신 솔루션 팀의 메디컬 라이터로 재직했다. ADM코리아에서는 후기 약물 연구를 담당하는 시판 후 조사(PMS) 팀의 메디컬 라이터로 활동했고 질병관리본부의 결핵 (TB) 및 AIDS 부문 선임 연구원으로 활동한바 있다.
김나현 박사는 메디데이터에 합류하기 전 한국아이큐비아에서 의료 기기 및 후기 약물 연구를 담당하는 한국 혁신 솔루션 팀의 메디컬 라이터로 재직했다. ADM코리아에서는 후기 약물 연구를 담당하는 시판 후 조사(PMS) 팀의 메디컬 라이터로 활동했고 질병관리본부의 결핵 (TB) 및 AIDS 부문 선임 연구원으로 활동한바 있다.

 

이 같은 데이터를 통해 합성대조군을 구축할 수 있을 것 같습니다. 미디어데이 당시에도 설명해 주신 부분이지만, 빅데이터를 통해 구축한 합성 대조군에 대한 설명을 좀 더 들어보고 싶습니다.

"합성대조군은 항암제 등 임상시험에는 기존 데이터를 뽑아서 대조군을 생성하고 활용하자는 개념입니다. 기존 무작위대조군의 경우 시험대상자가 대조군에 배정될 경우 연구에서 이탈하거나, 사망해 연구데이터를 사용하지 못하는 경우들이 발생할 수 있기 때문입니다.

FDA나 ICH 가이드라인에도 시험군과 동일한 조건의 데이터를 사용하고 여러 통계오류를 최소화하며 문제발생 시 해결할 수 있어야 한다는 조건 하에 합성대조군을 포함한 외부대조군을 일반대조군과 동일하게 활용할 수 있다고 명시돼 있습니다."

 

시험군과 동일한 조건의 데이터는 어떤 식으로 구축할 수 있을까요?

"미데어데이 당시 소개드린 내용으로 설명드리겠습니다.

위 표에서 초록 점들은 시험군 연구 데이터입니다. 초록색 점들 음영이 다른 이유는 데이터의 성향이 다르다는 의미입니다. 

합성대조군 생성을 위해서는 제일 처음 선정제외 기준에 맞춰 데이터를 필터링 합니다. 원으로 묶인 파란색과 노랑색 점입니다. 여기서 노랑색은 걸러지는 데이터입니다. 예를 들어 연구 설계에 맞지 않은 나이대 등일 수 있습니다.

이후 기준에 맞는 데이터들을 비슷한 성향끼리 짝을 지어서 데이터의 차이가 거의 없도록 구성합니다. 이 매칭 방법이 결과적으로는 무작위 배정과 동일한 효과를 낼 수 있는 방법이 되는 것입니다."

 

실제로 국내 업계에서 활용된 AI나 빅데이터 사례가 있다면 들어보고 싶습니다.

"대표적으로 말씀드리면, 스터디 피지빌리티(Study Feasibility)가 있습니다. 

빅데이터와 AI를 활용해서 개발업체 니즈를 충족하고 있는데요, 자세히 얘기하면 연구를 진행하고자 하는 병원을 선정하는 데 도움을 주거나, 환자 등록률 파악을 돕는 역할을 합니다. 

희망하는 연구에 잘 맞는 병원, 괜찮은 병원 등을 선정할 수 있고, 이 병원에서 연구를 했을 때 환자 등록이 얼마나 잘 될 지 예측할 수 있도록 돕기도 합니다.

그동안 임상시험을 진행하며 축적된 데이터를 통해서 특정 임상을 진행한다고 가정했을 때 여러 병원들의 등록률을 예측할 수 있기도 하며, 병원에서 진행되는 경쟁연구들이 많은지도 파악할 수 있습니다. 

구체적으로는 웰마커바이오가 스터디 피지빌리티 솔루션을 활용해 해외 임상시험기관을 선정했고 현재 대장암 치료제를 개발 중입니다.

"AI 관련해서 한 가지 말씀드리면, 기술을 어떻게 사용하는지가 굉장히 중요합니다. 임상시험은 기획단계부터 굉장히 중요하고, 임상연구에서 디자인, 즉 연구설계를 계획하는 단계부터 산업 전반에 대한 이해가 매우 중요합니다. 임상시험 같은 경우, 임상시험에 대한 이해도가 설계 완성도를 좌우하기도 합니다"
"AI 관련해서 한 가지 말씀드리면, 기술을 어떻게 사용하는지가 굉장히 중요합니다. 임상시험은 기획단계부터 굉장히 중요하고, 임상연구에서 디자인, 즉 연구설계를 계획하는 단계부터 산업 전반에 대한 이해가 매우 중요합니다. 임상시험 같은 경우, 임상시험에 대한 이해도가 설계 완성도를 좌우하기도 합니다"

 

민감한 질문일 수 있습니다만, 우리나라 제약산업계는 최근 입법 절차 등을 통해 신약개발로의 체질 개선을 '준비 중'인 상황입니다. '에이콘AI가 당장 필요한가?'라는 의문이 생깁니다.

"우리나라는 신약개발이 타 선진국에 비하면 적긴 하지만, 시도가 계속 늘어나고 있는 추세입니다. 이 부분만 생각해도 충분히 니즈가 있다고 판단하지만 더 큰 이유는 신약개발이 국내 연구에 머무르지 않고 미국이나 유럽 등 글로벌 시장으로 나아가려는 움직임도 많아지고 있습니다.

또 바이오벤처들이 생겨나고 예산과 인력이 상대적으로 부족한 바이오벤처들은 처음부터 글로벌 임상만을 바라보고 연구를 진행하기도 합니다. 한 번에 FDA 등 글로벌 규제기관에서 승인을 받고 임상을 계속하거나, 라이선스아웃을 하거나, 펀딩을 추가로 받기를 원하기 때문입니다."

 

바이오벤처에서도 에이콘AI를 활용한 연구가 이뤄지고 있나요?

"구체적인 업체 수를 말씀 드릴 수는 없지만 2~3년 전부터 바이오벤처 고객사가 늘고 있습니다. 특히 우리나라의 경우 IT관련 수용도가 굉장히 빠르기 때문에 에이콘AI에서 한국을 위한 별도 팀을 마련한 상황입니다."

 

Acorn AI는 어떤 회사?

에이콘 AI는 임상시험 데이터와 리얼월드 데이터를 활용해 혁신적인 예측 모델을 제공하는 메디데이터의 AI특화기업이다.

에이콘 AI의 플랫폼인 '에이콘 AI'는 임상시험 연구의 설계 및 대상자 등록 파악, 임상시험 및 리얼월드 데이터 분석을 통한 인사이트 제공, 시판 이후 커머셜 데이터의 관리 및 분석 등을 지원한다.

메디데이터 측에 따르면 맥킨지, 얀센, 머크, IBM, FDA 등 다양한 업계 출신 전문가가 데이터 분석 및 인사이트 도출에 참여했으며, 60 여명의 데이터 과학자, 생물통계학자, 임상 전문가 등으로 이루어진 데이터 전문 팀을 구성하고 있다.

저작권자 © 히트뉴스 무단전재 및 재배포 금지