인터뷰 | 최봉규 GC녹십자 데이터사이언스팀 상무

정부가 보건의료 빅데이터 활용계획 지속적으로 내놓으면서 데이터 개방 속도를 높이고 있다. 특히 데이터 3법 개정과 마이헬스 데이터 사업 등은 데이터 구축과 활용 형태를 고도화시키고 있다는 의견이다. 보건의료 데이터는 의약품 개발 전주기에 활용 가능하기 때문에 산업계의 갈증이 클 수 밖에 없지만 국내 제약사들에서 데이터를 다룰 수 있는 전문인력은 부족한 상황이다. 이 같은 가운데 GC녹십자가 작년 데이터사이언스팀을 신설하고 적극적인 데이터 활용에 나서고 있다. 히트뉴스는 GC녹십자 데이터사이언스팀 최봉규 상무와 인터뷰를 진행했다.

GC녹십자 DataScience팀, 뭐하는 곳이죠?
지난해 처음 신설된 부서이고, 현재 저를 포함해 4명의 팀원이 있습니다. 저희 팀의 업무는 크게 세가지입니다. 빅데이터 분석을 통한 제품의 효능과 안전성 조사, 품질 및 공정 테이터 분석 및 해석 지원, 그리고 개인맞춤 용량 계산기 개발 프로젝트입니다. 그 외에 사내 기초통계 및 약물역학 교육도 실시하고 있습니다.
산업계에서 빅데이터는 정말 중요한가요?
의약품 개발의 전 주기(초기 개발에 대한 의사결정부터 허가 관리까지)에 걸쳐 빅테이터나 리얼월드데이터(Real World Data, RWD)의 중요성은 점점 증가하고 있어요. 지금도 그렇고 앞으로는 더욱 더 얼마나 테이터를 잘 활용하느냐에 따라 의약품 개발 비용과 속도, 성공 여부, 시장성이 많이 달라질 것이라고 생각합니다.
GC녹십자의 빅데이터 활용 사례가 있을까요?
앞서 말씀드린 것처럼 빅데이터나 RWD는 의약품 개발의 전 주기에 다 활용될 수 있습니다.
저희 회사는 희귀질환 (뮤코다당증 II형) 신약 개발 과정에 RWD를 활용한 임상시험을 진행했고 일본에서 허가 (헌터라제 ICV:intracerebroventricular)를 받은 경험이 있습니다. 또한 허가 후 관찰연구, 급여 등재 차원에서도 보건의료 빅테이터를 활용한 연구들을 진행했고요. 마케팅 차원에서도 빅테이터 (예, 유비스트 테이터뱅크)를 활용한 간단한 분석은 자체적으로 진행하고 있습니다.
지금 상황을 살펴보면 학교나 데이터전문회사 등에서 빅데이터 활용 연구를 많이 하는 반면 회사에서는 그렇지 못한 상황인데 이유는 무엇인가요.
우선 국내 제약사의 경우 통계를 잘 이해하고 의약품 관련 다양한 데이터를 다룰 수 있는 전문인력이 많이 부족한 상태입니다. 글로벌 제약사의 경우 약 10여년 전부터 테이터 사이언스팀을 운영해오고 있지만, 국내 제약사의 경우 테이터 사이언스팀의 필요성에 대한 인식이 이제 확산되어 가고 있는 상황이라고 생각합니다.
최근 보건복지부가 '보건의료 데이터· 인공지능 혁신전략: Health Data F.L.O.W. 2025' 보고서에서 미래의료혁신 및 보건산업의 혁신성장에서 RWD 및 빅데이터, 인공지능(AI: artificial intelligence)의 중요성을 강조하기 시작했어요. 더불어 2023년부터 데이터·인공지능 팀을 설치 운영하는 제약 의료기기 기업에 혁신형 기업 인증시 가점을 부여하겠다는 계획을 발표했습니다. 이런 계획이 잘 추진된다면 좀 더 많은 국내 제약사에 데이터 사이언스팀이 생겨날 것이라고 봅니다.
보건의료빅데이터는 건강보험청구자료를 기준으로 하고 있어 퀄리티가 높다고 들었습니다. 또, 데이터를 받아보려면 그만큼 대기시간도 길다고 하던데요.
전국민 건강보험이 잘 갖춰진 한국의 건강보험청구자료 (코호트 자료 포함)는 포괄성이나 대표성 측면에서 퀄리티가 높다고 생각합니다. 하지만 보건의료데이터의 다양성, 접근성, 연계성 측면에서는 더 나아질 것으로 기대합니다.
또, 대기시간이 늘어난 것은 보건의료 빅테이터에 대한 수요가 늘어난 결과라고 생각합니다.
자료 청구에 앞서 해당 연구를 수행하는데 꼭 해당 자료가 필요한지에 대한 숙고가 필요하다고 생각됩니다. 이를 전제로 말씀드리면 크게 두 단계에서 병목현상이 발생할 수 있다고 생각합니다. 자료를 신청하고 검토하는 단계에서 그리고 신청이 승인된 이후 데이터 접근과 분석이 이뤄지는 단계에서 병목현상이 일어날 수 있습니다.
때문에 신청 승인 절차의 간소화, 심사 인력의 확충, 그리고 산업계가 데이터분석을 위해 사용할 수 있는 빅데이터센터의 확충 (계정 확충 등)을 통해 대기 시간을 조금은 줄일 수 있다고 사료됩니다.
산업계가 보건의료 데이터 활용하는데 기대할 수 있는 부분이 있다면요.
복지부에서 2025년까지 희귀질환, 암, 난치질환을 포함한 K-100만 통합 바이오(임상, 유전체, 건강검진 및 예방접종등의 다양한 빅테이터의 연계) 빅데이터를 구축하고 이를 의료계, 학계, 산업계 모두 이용할 수 있는 개발플랫폼을 구축한다고 했습니다. 이런 양질의 통합 빅데이터들과 플랫폼이 구축이 된다면 산업계의 연구 개발에 많은 도움이 될 것이라 생각합니다. 물론 이런 과정들은 개인정보에 대한 충분한 보호 대책과 사회적 합의에 기초한 거버넌스와 같이 해야 한다고 생각합니다.
데이터사이언스팀이 있는 회사는 드물어요. 그만큼 타사들이 GC녹십자를 주목하고 있을 것 같은데, 로드맵을 살짝 공개해주세요.
우선 현재 추진하고 있는 업무들을 바탕으로 팀 업무들을 더 체계화· 고도화할 수 있는 방안들을 모색하려 합니다. 통합 바이오 빅테이터를 분석하고 이를 연구 개발에 활용할 수 있는 시스템 구축, 품질 고도화 (QbD: Quality by Design)의 구체적인 사례 개발 및 사례집의 출판, 혈액 제제 기반 디지털 치료제 개발 등을 고려하고 있습니다. 또한 타 제약사의 데이터 사이언스팀들과 대학에 있는 데이터 사이언스 전문가들과도 교류를 확대하려고 하고 있습니다.
