특별기고 |
이영작 대표 ㈜엘에스케이글로벌파마서비스
1월 초 한겨울, 기온이 급변하는 시기인 만큼 건강에 주의하고 일기예보에 귀를 기울일 때다. 필자가 미국에 살 때는 화씨에 익숙해져 있어, 서울에 올 때 마다 섭씨 일기예보를 5로 나누고 9로 곱하고 32를 더해 화씨로 계산하고 외출 준비를 하곤 했다. 이제 귀국한지 26년이 지나면서 섭씨에 익숙해졌고 미국에 갈 때면 예보된 온도에서 32를 빼고 9로 나누고 5를 곱하여 얻어진 섭씨 온도를 보고 외출 준비를 한다.
한국과 미국은 온도 뿐 아니라 도량형의 기준도 다르다. 미국 식당에서는 스테이크 사이즈가 파운드(pound)로 메뉴에 표기돼 있고, 한국은 그램(gram)으로 표기되어 있다. 도로의 속도 표지판이 미국은 마일(mile)로 표시되고, 한국은 킬로(kilo)이다. 부피는, 미국은 핀트-갤런(pint-gallon)이며 한국은 리터(liter)이다. 집 크기는 미국은 제곱피트(sqft), 한국은 평 단위이다. 이제는 평방 미터(meter)로 생각해야 한다. 1평은 35.58제곱피트이다. 1 제곱미터(sqmeter)는 10.764제곱피트이다. 30년만에 귀국해 집을 구매할 때 몇 평의 거주공간이 적절할지 몰라 헤맨 적이 있었다. 감이 없었기 때문이다. 면적, 무게, 길이, 부피 등이 미국과 한국이 서로 다르기 때문에 귀국 초기 일상생활에서 많은 혼란을 겪었다.
영-미가 채택한 야드-파운드법(yard-pound system)을 영미법이라고 부르고 그 외 대부분 국가가 채택한 미터-그램법(meter-gram system)을 십진법이라고 부른다. 국가마다 다른 측정 기준(standard)이 국경을 넘나들면 각종 혼선과 문제가 발생한다. 이런 혼선은 일상생활에서만 일어나는 것이 아니다. 의학연구 또한 국경을 넘나들면서 많은 혼선이 일어난다.
임상시험에서 또는 의료행위에 있어, 과거에는 나라마다 또는 병원마다 또는 연구자(investigator)에 따라서 각기 서로 다른 측정방법을 고집하면서 각종 혼란이 일어났다. 임상시험의 역사가 일천하기 때문이다.

우리가 알고 있는 오늘날의 임상시험은 1962년 미국 상원에서 Kefauver-Harris Drug Amendment, K-H DA가 통과되면서 시작됐고 이에 제약회사는 신약의 유효성 증거를 FDA에 제출해야 하는 제도가 채택된 것이다.
K-H DA는 신약이 유효하다는 "실질적 증거(substantial evidence)"를 요구하고 "실질적 증거(substantial evidence)"는 "적절하고 잘 통제된 연구(Adequate and Well-Controlled(A&WC) Study)"에 의해 만들어져야 한다고 규정하였다. K-H DA 이전에는 의사들의 단체인 AMA(American Medical Association)가 신약의 유효성을 판단해 AMA가 유효하다고 하면 별도의 다른 증거가 없다 해도 그대로 인정되었다. 의사의 유효성에 대한 재량권이 임상시험보다 우선한 것이다. 예를 들자면 1940~50년도에 자연유산(spontaneous abortion)을 예방하기 위해 문제성 임산부에게 인공 에스트로겐인 디에틸스틸베스테롤(diethylstilbesterol)을 처방했다.
당시 시카고대학교(University of Chicago)에서 디에틸스틸베스테롤(diethylstilbesterol)이 효과가 없다는 임상시험 결과를 발표하였음에도 불구하고 의사들은 임상시험의 결과가 자신들의 의학적 판단과 다르기 때문에 받아들일 수 없다고 주장하면서 임산부에게 디에틸스틸베스테롤(diethylstilbesterol)을 계속 처방했다. 의사의 판단이 과학적 증거보다 우선하던 시절이었다. 그러나 디에틸스틸베스테롤 (diethylstilbesterol)이 효과가 없을 뿐 아니라 태어난 아이들이 10대로 성장하며 생식기관 희귀 암이 발생하면서 테라토젠(teratogen)이라는 것이 밝혀졌고 결국 1970년대에 사용이 금지되었다.
의사들의 의약품 유효성에 대한 독점적이고 독단적인(dogmatic) 판단을 대체하는 방법으로 K-H DA는 A&WC(Adequate and Well-Controlled) 연구에 의한 실질적 증거(substantial evidence)에 근거하여 유효성을 검증해야 한다고 법적으로 요구하기에 이른 것이다. 이 법안의 직접 동기는 탈리도마이드(thalidomide) 비극이었다. K-H DA가 1962년으로, 현대적 의미의 임상시험이 시작되었다. 우리가 아는 오늘날의 임상시험 역사는 60여년에 불과하다.
실질적 증거(substantial evidence)의 근거는 임상시험이 최선이라는 통계학자들의 주장에 힘이 실리면서 임상시험 방법론의 개발이 시작되었고 1970년대 말경에 비로소 무작위 대조연구(randomized controlled clinical trial)가 임상시험의 표준이 되기 시작했고 1980년대에 무작위 이중 맹검 대조연구(randomized double-blind controlled clinical trial)가 golden standard라고 인정되었다. K-H DA를 계기로 통계학자들이 임상시험의 중심에 서게 된 것이다.
필자는 통계학자로서 1977년부터 美 국립암연구소 (NCI(National Cancer Institute))에서 항암 임상시험에 참여하기 시작했고 당시 임상시험 대가들의 지도를 받으면서 임상시험 실무를 배우고 경험을 쌓았다.
20년 후 1997년 CDISC가 시작되었다. CDISC가 탄생한지 이제 27년이다. 사람으로 치면 성인이다. 1970~ 80년대 임상시험을 경험했다면 왜 데이터 표준화(data standardization)가 요구되는지 피부로 느낄 것이다.
임상시험의 원칙과 이론이 정립되고 방법론이 개발되었지만 임상시험 데이터는 모두 제멋대로 수집 관리되었다. 십진법과 영미법이 혼용되어 하나의 임상시험에서도 또는 동일한 병원에서도 연구자에 따라 metric system과 영미 system이 혼용되는 바람에, 데이터 관리자에게는 이를 하나로 통일하는 업무가 큰 일이었다. 성별을 M, F로 표기하기도 하고 0은 남성, 1은 여성 때로는 1은 남성, 2는 여성 등 제멋대로 였다. 날짜 표기도 다양해 혼란을 일으켰다. 나이는 연월로 표기하기도 하고 때로는 월로만 표기하기도 하고 때로는 소수점을 쓰기도 했다. 데이터는 페이퍼(paper)에 입력되는데 항상 오류와 혼란의 연속이었다. Vital sign 측정도 기구나 방법이 통일되지 않았다. 혈압측정 같은 기초적인 업무도 모두 자신의 프로토콜을 만들어 측정했다. 데이터 분석에 앞서, 뒤죽박죽인 데이터를 클린(clean)하고 정돈하는 업무가 큰 일이었다. 데이터의 통합 역시 간단하지 않았다.
필자가 겪은 경험을 소개하겠다. 1980년대에 임신성 당뇨병(Gestational diabetes)에 관한 연구가 있었다. 임신성 당뇨병은 심각한 문제이다. 태아가 심각한 선천성 기형(major congenital malformation)을 갖고 태어날 수도 있고 임산부의 생명이 위협을 받을 수도 있다. 그 연구에서 경미한 선천성 기형(minor congenital malformation)에 관한 데이터도 수집했다. 미국의 명문 의대 5곳이 참여했는데 모두 각각 다른 기준으로 경미한 기형에 관한 데이터를 수집했다. 결국 이 데이터는 분석이 불가능해 경미한 기형에 관한 데이터분석은 포기해야 했다. 데이터 표준화가 되지 않았기 때문이었다.
FDA는 NDA에 제출하는 데이터를 재분석해 검증한다. NDA 제출은 수십개의 임상시험 데이터로 구성된다. 이 데이터들이 모두 제 각각이면 NDA 심사에 혼선이 생기고 심사시간이 지연된다. 신약 NDA가 늘어나고 데이터가 복잡해지면서 데이터 표준화의 필요성이 커졌다. CDISC의 탄생이 NDA 제출(submission)과도 깊은 관계가 있음을 쉽게 이해할 수 있다.

필자는 데이터가 비교적 단순하고 규모도 킬로 바이트(kilo-byte) 수준일 때 임상시험을 시작했다. 이제는 데이터의 규모가 메가 바이트(mega-byte), 기가 바이트(giga-byte)를 거쳐서 테라 바이트(tera-byte) 시대로 진입하고 있고 데이터 소스(source)는 점점 다양해지고 디지털 헬스 테크놀로지(digital health technology)가 광범위하게 적용되기 시작하면서 데이터의 표준화가 필수가 되어서 CDISC의 역할이 날이 갈수록 커지고 있다. 표준화되지 않은 데이터는 분석이 불가능하기 때문이다.
2022년 9월 폴란드 크라쿠프(Krakow)에서 개최된 Pharmaceutical Contract Management Group의 연례회의(Annual Conference)에서 200명이 넘는 참석자들에게 2050년 임상시험의 모습에 대한 질문이 있었다고 한다. 누가 제약산업의 주체가 될 것인가에 대한 질문에 대해, 답은 제약회사도 CRO도 아닌 구글, 아마존, 애플과 같은 빅테크 기업이 제약산업의 주체가 될 것이라는 컨센서스(consensus)가 있었다고 한다. CRA(Clinical Research Associate)라는 직종은 없어질 것이고 임상시험은 중앙에서 관리되고 데이터는 다양한 도구(tool)에 지배될 것이라고 예측했다. 미래의 질병은 "전자 해부 키트(electronic dissection kit)"로 정의될 것이라고 예상하면서 미래의 질병은 데이터로 규정될 것이라고 했다.
의학이 의학적 관찰과 판단에 의존하는 "임상 과학(clinical science)" 시대에서 벗어나 데이터에 근거하여 판단되는 "데이터 과학(data science)" 시대가 시작되고 있다. 데이터 과학자(data scientist)가 임상시험과 의학에서 대제사장(high priest)이 되는 세상이 코앞에 있다. 데이터 과학자의 가장 중요한 요구사항은 데이터의 표준화에 있다. 필자가 30여 년 전에 경미한 기형(minor malformation) 데이터를 버렸듯이 데이터 과학자는 무질서한 데이터는 쓰레기 통에 버릴 것이다. "Garbage in garbage out"이다. 테라 바이트(Tera-byte) 규모의 데이터라도 표준을 못 맞추면 쓰레기에 불과한 것이다. 질서정연한 데이터만 살아 남는다. CDISC가 의학과 임상시험의 질서정연한 데이터시대의 강자가 되어 가고 있다.
리얼월드데이터 (Real World Data)도 빅데이터(Big Data)도 무질서하고 표준을 못 맞추면 결국 무용지물(無用之物)에 불과하다. CDISC는 데이터의 표준을 만들고 표준화된 데이터는 데이터 과학의 기본이다.
대한민국은 임상시험 세계 4대 강국이다. 우리나라도 금명간 CDISC시대가 열릴 것을 기대하여 본다.

이영작 엘에스케이글로벌파마서비스 대표
서울대학교 공과대학 전자공학과를 졸업하고 미국 오하이오 주립 대학교(Ohio State University)에서 통계학으로 석·박사를 받았다. 이후 통계학 박사학위 소지자로 미국 국립암연구소(NIH), 국립신경질환연구소, 국립모자건강연구소 등에서 데이터 통계분석과 임상연구를 담당했다. 1999년 한국으로 귀국해 한양대학교 석좌교수를 겸임하며 2000년도에 엘에스케이글로벌파마서비스(LSK Global PS)를 설립했다. 그는 한국임상CRO협회장을 역임해 국내 CRO산업 발전에 기여했을 뿐 아니라 세계 3대 권위 인명 사전인 ‘마르퀴즈 후즈후’에도 등재됐다. 현재 서경대 석좌교수를 겸임하고 있다.
