바이오코리아 2023
헬스케어 빅데이터 쇼케이스 성과 공개
정밀의료 시작은 빅데이터 구축…동의와 연계에 주력
정밀의료 도입을 위한 100만명 규모 헬스케어 빅데이터 구축이 2024년부터 본격 시작된다. 산·학·연으로 구성된 '헬스케어 빅데이터 쇼케이스 구축 사업' 관계자들은 2020년부터 2022년까지 진행된 1단계 사업 경과를 보고하며 추후 계획을 공개했다.
한국보건산업진흥원과 충청북도 주최로 10일부터 12일까지 열리는 '바이오코리아(BIO KOREA 2023)' 첫 날인 10일 관계자들은 환자 동의 및 데이터 통합 플랫폼 구축 및 이를 바탕으로 한 △개별 유전자 △단백질 △전사물 △대사물 등 토탈 데이터인 '오믹스(Omics) 데이터' 구축 과정을 소개했다.
헬·빅·쇼의 목표…환자 동의와 데이터별 연계에 고심
2020년부터 2022년까지 1단계 사업 중 사업단이 주력했던 분야는 데이터 활용에 대한 환자 동의와 각 데이터 별 연계 수단이었던 것으로 나타났다.
류승호 강북삼성병원 교수는 존스홉킨스대학과 함께 진행한 건강보험 수진자 환자 데이터 구축 과정에서 자발적 동의에 대한 확인, 개인정보 수집 여부, 공공자료 연구 등 동의·서명 과정을 전산화했고, 이를 위해 사업 참여 안내 및 동의서 작성·저장할 수 있는 앱을 배포했다고 밝혔다.

류승호 교수는 "쇼케이스 사업은 말 그대로 공유 가능한 데이터를 모아서 연계하는 과정인 만큼 자발적인 환자 동의가 필요했다"며 "또한 일상기록 추적을 위한 웨어러블 디바이스 활용 및 기록 수집을 통해 광범위한 데이터로 융합해 큰 가치를 만들고자 한다"고 밝혔다.
데이터 활용을 위한 환자 연계 외에 또 다른 고민은 여러 종류로 수집된 데이터 간 연계였다. 여기에는 유전체 데이터와 임상 데이터 외에도 공신력 있는 논문화 된 데이터와 RWE/RWD와 같은 실증 데이터도 포함됐다. 의료데이터 전문기업 쓰리빅스 박준형 대표는 1단계 사업 중 이 같은 데이터들을 결합할 수 있는 플랫폼 필요성을 확인했으며, 이 같은 데이터를 취합할 수 있는 '3X-Onmics' 구축에 나서고 있다고 밝혔다.
박준형 대표는 "의료 데이터를 포함한 일상, 논문, 실증 데이터를 모두 취합할 수 있는 플랫폼 필요성을 1단계 사업 중 확인했다"며 "전체 유전체 데이터는 물론 뇌, 간 등 특정 조직별로 세분화 할 수 있는 개인유전체를 분석할 수 있는 플랫폼 구축에 나서고 있는 상황"이라고 설명했다.
잘 모인 빅데이터, 효과적으로 사용하려면 '합성 데이터' 필수
합성 데이터는, 실제 환자의 건강정보, 민감정보를 모두 포함한 이른 바 '원전 데이터'를 실전 연구에 활용할 수 있도록 합성된 데이터다. 실제 사람의 눈, 코, 입을 모아 새로운 형태의 얼굴을 만들어내는 방식으로, 실제 데이터를 기반으로 동일한 속성은 유지하면서 임상연구에 활용할 수 있도록 고안된 개념이다.
박정선 한국보건산업진흥원 박사는 "쇼케이스라는 의미 그대로 헬스케어 빅데이터를 국민이 체감하고 사용할 수 있도록 합성데이터를 구축하고 원전데이터와 합성데이터 사용법을 분리했다"며 "실효성있는 데이터 사용 환경을 구축할 것"이라고 설명했다.

박정선 박사에 따르면 합성데이터는 빅데이터 분석센터에서 연구가 가능하다. 원천 데이터 연구에 필요한 데이터 제공 심의위원회 심의가 필요하지 않으며, 데이터 분석 결과물 출력 등이 가능하고 연구자가 필요한 소프트웨어 등을 일부 사용할 수 있다.
이 같은 헬스케어 빅데이터의 수집·동의·연계 방식은 결국 우리나라만의 '바이오 뱅크' 구축 기반이 될 전망이다.
김주한 서울대 의과대학 정보의학교실 교수는 "1단계 사업의 목표는 국가 바이오 빅데이터 사업에 필요한 경험과 기술의 확보"라며 "기술적 시스템을 시작으로 유전자, 일상기록, 의료·검진 데이터 베이스를 구축하고 활용하는 기술적 경험을 만드는 것"이라고 설명했다.

또한 그는 "의료데이터는 병원, 의사마다 다른 이질적인 성격을 가진 만큼 이를 표준화하고 그 과정에서 발생하는 정보주체, 정보주권을 보장할 수 있는 병행적인 방법론이 연구된 만큼 추후 헬스케어 빅데이터 활용에 기반이 될 수 있을 것"이라고 덧붙였다.
헬스케어 빅데이터 쇼케이스 사업
정밀의료 생태계를 조성하고 서비스 기반을 마련하기 위한 다부처 사업 필요성이 제기되면서 헬스케어 데이터의 전주기(동의·수집→보관→개방·활용)에 걸친 데이터 활용 절차 및 표준 개발, 활용 경험 확산을 위한 사업.
2020년부터 3년간 추진됐으며, ‘헬스케어 빅데이터 쇼케이스 구축 사업’은 '열린 과학(Open Science)', '열린 데이터(Open Data)'에 대한 시대적 요구에 따라 산업·학교·연구소 등 다양한 분야의 증가되는 헬스케어 데이터 공유 요구에 대응하고, 이에 대한 지원 체계 및 정책 마련을 위한 사업으로 기획됐다.
