HiterView
성균관대 의약품규제과학센터 남진현 교수·오인선 박사
"보건의료 빅데이터 자료분석 기초 이론과 실습 과정 6월 오픈"

데이터 전문가들은 데이터가 쌓이면 당연히 이를 분석하고 싶은 욕구가 생긴다. 그런 그들에게 단일건강보험체계로 전국민이 가입한, 그리고 장기간 누적된 퀄리티 높은 '보건의료빅데이터'는 매력적일 수 밖에 없다. 하지만 빅데이터를 활용하는 이들은 더이상 전문가들에게만 국한되지 않는다. 데이터 활용에 대한 관심이 증가하고 데이터 중요성을 인지하기 시작한 '빅데이터 시대'가 도래하면서 데이터없이는 생존이 어려운 시기가 온 것이다. 이에 성균관대학교 의약품규제과학센터는 '보건의료 빅데이터 자료분석을 위한 기초 이론 및 실습과정'을 마련했다. 통계학 박사 남진현 교수와 약물역학을 전공한 오인선 박사가 강사로 나서 보건의료분야에서 자주 이용되는 기초 통계이론과 보건의료빅데이터 분석기법(SAS)을 익힐 수 있는 시간을 갖는다.
'보건의료빅데이터 자료 분석' 교육이 신설돼 흥미로운데요, 도대체 보건의료빅데이터는 무엇을 말하나요.
남진현 교수 : 주로 병원에서 생성되는 자료로, 그중에서 일반적으로 저희가 사용할 수 있는 자료는 건강보험청구자료를 기준으로 생각을 하죠. 그 데이터 자체가 방대하고 퀄리티가 높아요. 또 EMR(전자의무기록)이나 EHR(전자건강기록) 등 병원내 기록자료도 있는데, 병원에서 공유를 잘 안하기 때문에 자체데이터라고 볼 수 있어요. 하지만 미국 등은 EHR 자료를 공유해 같이 연구하는 단계를 거치고 있어 우리도 데이터 쉐어환경이 더 나아지지 않을까 생각하고 있습니다.
어떤 목적으로 신설된 과정이죠? 두분이 맡으신 강의 주제와 내용도 다른 것 같아요.
남 : 지금은 적응증이나 부작용 등 리얼데이터를 이용해 보고를 할 수 있게 됐는데, 막상 데이터를 활용하려니 제대로 다룰 수 있는 인력도 없고, 데이터에 대한 이해자체도 부족한 상황이에요. 그런 부분을 해소하고자 마련된 교육이에요.
오인선 박사 : 구체적으로 이번 과정은 보건의료분야에서 자주 이용되는 기초 통계이론과 보건의료 빅데이터 자료를 이해하고, 이를 활용하기 위한 분석기법(SAS 활용법)을 익힐 수 있도록 마련됐어요. 건강보험청구자료를 기반으로 보험약가 등재업무(Market access), 약물역학(Pharmacoepidemiology or Pharmacovigilance) 연구에 적용할 수 있도록 이론과 실무에 타깃된 교육이라고 이해하시면 돼요.
남 : 총 4일동안 진행되는 교육 중 제가 전반부를 담당해요. 주로 보건의료 자료를 핸들링하기 위한 SAS프로그램 기초를 다룰 예정입니다. 데이터 입출력은 물론, 청구자료 분석을 하기 위해 필요한 많은 SAS명령어들 중에서 직접적으로 사용하기 좋은 현실적인 명령어들 위주로 구성해 강의를 할 계획이에요.
오 : 이론을 배우고 오면 의료이용 및 의료비 지출 사례분석, 의약품 복용과 이상사례의 역학관계 사례 분석에 관해 실습위주로 교육이 진행됩니다. 이론과 실제로 하는 것은 차이가 커요. '분명 이렇게 하는건데'라고 생각했지만 올바르지 않은 경우가 많아서 실습과정에서 실수하기 쉬운 부분도 바로잡아주고, 노하우도 알려드리는 거죠. 지루하시지 않을 거에요.
강의 주제가 매력적인데 수요는 있을까요?
남 : MA나 마케팅 등 실제 업계에서 가장 많이 요청하는 영역이에요. 통계프로그램 사용료도 만만치 않은데다 전문가도 없고, 회사에서 직접 다루지 않기 때문에 외부에 의뢰를 하는데, 이번 과정을 듣게되면 데이터 결과를 깊이있게 이해할 수 있게 될 거에요. 당장 급여관련 업무를 할때 어느정도 자체적인 내부자료를 구비할 정도는 되지 않을까 싶어요.
학계·산업계에서 빅데이터가 갖는 중요도나 위치는 어느 정도일까요.
오 : 지금까지 빅데이터를 활용해 수십건의 논문을 썼었는데, 아무래도 데이터 정확성이 RCT에 비해서는 떨어질 수 밖에 없었지만, 시간이 지나면서 리얼월드에비던스(RWE) 등에 관심이 높아지고, 더불어 데이터에 대한 위상도 높아진 것 같아요.
남 : 시대적인 트렌드랑 맞닿아 있는 것 같아요. 예를들면 어떤 치료제에 대한 약효를 알아보려면 RCT를 해야 하는 것은 맞아요. 하지만 임상에서 사용되는 경우는 RCT 환경이랑 너무 다르거든요. 환자들이 통제된 상태에서 약을 먹는 것이 아니고, 의사의 지시를 잘 따르는 것도 아니어서 약효와 부작용을 보기에 RCT만으로 부족하죠. 보건의료 빅데이터 등을 통해 해소할 수 있고, 그래서 데이터에 대한 수요가 늘어나는 거죠.
다만, 인프라가 부족해요. 자료 자체에대한 한계도 있고, 자료를 컨트롤할 수 있는 인력문제도 있어 아쉬운 상황이죠. 가장 시급한 것은 데이터에 접근할 수 있는 인프라를 확장시켜 주는 것이에요.
청구자료를 보기위해 신청하면 6개월 이상 걸린다는 얘기도 있더라고요.
오 : 지금은 1년은 기다리는 것 같아요. 예전보다 확충이 되긴했지만 공급이 수요를 못따라가고 있죠.
사실 우리나라 보건의료빅데이터가 세계적으로 퀄리티가 높은 데이터에요. 단일의료보험에 전국민이 의료보험에 가입돼 있어 연구자 입장에서 이렇게 좋은 데이터는 없죠. 특히 입원했을 때 약물 정보에 대해 접근이 가능한데, 해외 선진국도 그런 데이터를 확보하기 힘들어요.
빅데이터시대라고 하지만 데이터 활용에 앞서 개인정보보호법 등 민감한 사안이 있잖아요.
남 : 일단 데이터3법 이후 바뀌고 있는 것이 병원자료를 세어하려는 움직임이 계속 생기는 거에요. 큰 병원위주로 데이터 판매 시스템을 구축하고 있는 거죠. 청구자료에서 가장 큰 아쉬운 점은 임상데이터가 없다는 것이에요. 임상자료는 병원에 다 있고, 데이터3법 이후 병원들이 데이터 판매를 하려는 움직임이 있죠.
사실 개인정보보호는 큰 문제는 아니에요. 민감한 사안인만큼 관리도 잘하고 있거든요. 그런 인식이 저변에 깔려있기 때문에 더 많은 정보가 세어되지 못한다는 것이 문제죠.
아직 보건의료분야서 데이터를 다루는 인력이 부족한 것 같아요.
남 : 지금은 제공되는 데이터를 받아서 사용하고, 이를 가용할 수 있는 사람들도 특정돼 있지만 데이터에 대한 지식을 갖춘 분들이 늘어나면 오히려 퀄리티 높고 건강한 정보를 요구할 수 있을 거에요. 그런 데이터를 통한 연구의 결과도 좋기 때문에 선순환이 가능하겠죠.
다시 교육 주제로 돌아와서, 어떤 분들이 들으면 좋을까요.
남&오 : 시대의 흐름에 맞춰 새로 마련된 강의로, 방대한 내용을 4일이라는 짧은 시간에 액기스만 모아서 전달해 드려요. 초ㆍ중급자들 대상으로 교육을 진행하고 이후 호응을 살펴 심화과정을 구상할 계획을 가지고 있어요.
마케팅 또는 MA분들에게 분명 도움이 되는 강의에요. 특히 실무자들이 움직여야 변화가 있기 때문에 실무진들이 많이 들으셨으면 좋겠어요.
남진현 교수
성균관대 수학사, 경영학사/ 성균관대 통계학석사/ 성균관대 통계학박사
2016 성균관대학교 약학연구원 선임연구원
2017 성균관대학교 약학대학 연구교수
2017-2019 Senior Research Associate, Department of Public Health Sciences, Medical University of South Carolina, USA
2020-현재 성균관대학교 약학대학 연구교수
오인선 박사
성균관대학교 경제대학, 통계학과/ 박사 (2021. 8월예정), 성균관대학교 약학대학, 약물역학전공
Association between DPP-4 inhibitors and COVID-19 Related Outcomes among Patients with Type 2 Diabetes. Diabetes Care. 2021 Jan. [IF 16.019, JCR 상위 3%; 공동저자] 등 국제 SCI급 학술지 총 23편 게재
보건의료빅데이터 자료 분석과정
6월 24일, 25일, 29일, 30일 총 4일간 한국제약바이오협회 2층 K-room에서 진행되며, 5월 10일부터 신청가능하다. 모집인원은 30명 내외다.
