국회서도 질병통계 관련 법률안 줄줄이 보류
생명윤리보호법 적용하자는 의견도

[Hit-check] 인공지능 신약개발 핵심은 '데이터'③

인공지능이 신약개발 영역까지 들어왔다. 정부, 제약사, 협회 등 유관기관도 모두 신약개발에 인공지능을 하겠다고 나섰다. 이런 가운데 아직까지도 인공지능 신약개발을 활용 가능성에 의문을 제기하는 목소리도 있다. 히트뉴스는 인공지능이 신약개발이 현재 어디까지 진행됐고, 현재 어떤 어려움이 있는지 짚어봤다.

1) 신약개발에 AI 활용 어디까지 가능한가 – 국내외 기업을 중심으로
2) 공공데이터베이스 구축의 필요성과 한계
3) 개인정보보보호법에 발목 잡힌 '데이터 활용'

 

건강정보는 개인정보?

앞서 두 편의 기사에서 말했듯 인공지능의 핵심은 양질의 헬스케어 데이터를 확보해 이를 데이터베이스화(DB)하는 것이 관건이다. 그러나 전문가들 사이에서는 국내에서는 개인정보보호법으로 인해 헬스케어 데이터를 활용할 모든 길이 막혀 있다는 주장이 제기되고 있다.

전문가들이 헬스케어 데이터 활용과 관련해 개인정보호법을 지적하는 이유는 이렇다. 개인정보는 식별이 가능해야 한다. 엄밀히 말해 우리가 생각하는 개인정보와 개인정보보호법에서 규정하는 개인정보 사이에는 괴리가 있다. 개인정보를 법률상에서 정의하는 내용으로 좀 더 정확히 표현하기 위해서는 개인 '식별' 정보라고 표현해야 한다.

키, 몸무게, 유전자 정보 등은 개인을 식별할 수 있는 정보일까? 식별유무에 따라 헬스케어 데이터는 개인정보로 인식돼 활용에 어려움을 겪는다. 

그렇다면 키와 몸무게는 개인정보로 볼 수 있을까? 일단 우리가 쉽게 인식하기에 키와 몸무게는 개인정보다. 그러나 키와 몸무게를 가지고 개인을 ‘식별’할 순 없다. 키 180cm, 몸무게 80kg인 정보를 가지고 누군지 식별할 수 없다. 그러나 키와 몸무게는 건강정보(민감정보)에 해당한다. 민감정보는 개인정보보호법에 보호받는다. 키와 몸무게 정보만 가지고 어느 한 쪽에서는 식별성이 없기 때문에 개인정보보호법에 의해 활용하는 데 문제가 없다고 할 수 있다. 또 다른 쪽에서는 몸무게 키가 민감정보에 해당하는 건강정보이기 때문에 활용이 불가능하다고 볼 수 있다.

신수용 삼성융합의과학원 교수는 생명공학정책연구센터에 낸 기고문을 통해 “개인정보보호법에 저촉된 헬스케어 데이터 활용과 관련해 정확히 유권 해석을 해 줄 인력이 없다”며 “사실 우리나라에서 개인정보보호법이 그렇게 막강한 힘을 가지고 있는지 다양한 의견이 있을 수 있다”고 했다.

그러면서 “국민건강보험 공단은 의료 빅데이터를 공개해도 된다고 생각한다. 공단은 생명윤리위원회(IRB)만 받으면, 데이터 공개와 관련해 크게 법적으로 저촉될 것이 없다”며 “데이터를 공개했을 때 (공단 등 정부 기관이) 감내야 할 부분이 많아 데이터 공개를 쉽게 하지는 못 하는 것 같다”고 했다.

개인정보보호법에 가로막힌 헬스케어 데이터

개인정보보호법으로 인해 헬스케어 데이터 활용에 가장 먼저 제약을 받는 곳은 병원 데이터다. 개인진료정보는 민감정보로 분류되는데, 민감정보의 경우 데이터베이스를 구축해 활용하는 데 있어서 많은 제약이 뒤따른다. 실제로 개인정보보호법으로 인해 헬스케어 데이터베이스 구축 문제가 제동이 걸린 사례가 있다.

심·뇌혈관질 유병력자 관리와 암데이터사업을 위해 환자 정보를 수집할 수 있도록 근거를 마련하려던 입법안들이 줄줄이 가로 막혔다. 국회에서도 헬스케어데이터를 활용하는 데 있어 개인정보보호법 유권해석에 어려움을 겪고 있는 것이다.

지난 7월 16일 열린 보건복지위원회 법안심사소위원회 2차 회의록에는 헬스케어 데이터베이스 구축이 개인정보보법으로 인해 어떤 제약을 받는지 상세히 다뤄졌다. 환자정보 관련 근거를 담은 당일 심사안건은 자유한국당 유재중 의원이 대표 발의했던 심·뇌혈관질환예방관리법개정안과 더불어민주당 기동민 의원이 제출한 암관리법개정안이었다.

공개된 회의록을 보면, 박종희 수석전문위원은 개인의 동의를 받지 않은 건강과 관련한 민감정보를 수집해서 사업을 추진하려면 공익이 보다 구체적으로 제시돼야 하고, 개인정보 악용 등 국민의 기본권이 심각하게 침해되는 상황을 방지하기 위한 입법적 보완방안이 마련돼야 한다면서 심도있는 검토가 필요하다고 했다. 결국 암관리법개정안은 이날 제3자 정보제공 관련 조문으로 인해 제대로 검토되지 않은 채 심사 보류됐다.

보건복지부, 과학기술정보통신부, 산업통상자원부는 2021년까지 약 300억원을 예산을 집행해 '국가 바이오 빅데이터'를 구축하겠다고 밝혔다. 1단계 과제로는 희귀·난치병 대상으로 2만명 규모의 바이오빅데이터를 구축하겠다고 밝히고 있다. 

이창선 과학기술정보통신부 생명기술과장은 히트뉴스에 개인정보 활용과 관련해 "시민사회가 우려하는 개인정보 유출 등의 문제는 현재 바이오빅데이터 사업 등을 통해 보완점을 찾아 나갈 예정"이라고 했다. 

“헬스케어 데이터 비식별화, 데이터 왜곡 소지 있어”

보건의료 데이터를 활용하기 위해 비식별화 하자는 제안도 있다. 비식별화란 개인을 알아볼 수 있는 개인식별정보를 제거하는 것이다. 그러나 신 교수는 비식별화는 자칫 데이터 왜곡을 초래할 수 있다고 지적했다.

보건의료 데이터를 활용하기 위해 비식별화 하자는 제안도 있다. 신 교수는 비식별화는 자칫 데이터 왜곡을 초래할 수 있다고 지적했다.

그는 헬스케어 데이터 활용과 관련해서는 개인정보호법이 아닌 생명윤리보호법을 따르는 것이 더 타당하다고 주장했다. 그는 “의료보건 데이터는 일반법인 개인정보보호법이 아닌 특별법인 생명윤리보호법을 적용하는 것이 더 타당해 보인다”며 “모든 인간 대상 연구는 생명윤리위원회(IRB)를 거쳐야 하기 때문에, IRB를 받으면 굳이 개인정보보호법까지 거칠 필요는 없어 보인다”고 했다.

또 유럽처럼 우리도 의료정보를 활용하는 데 있어 개인정보를 절대적 권리가 아닌 사회적 권리로 유동적으로 해석해야 할 필요가 있다는 전문가 의견도 있다.

유소영 울산의대 교수는 지난해 11월 열린 2018 바이오 혁신성장대전에서 “우리 역시 EU의 개인정보보호 규정인 GDPR처럼 개인정보가 절대적 권리가 아닌, 사회적 권리와 비례한 원칙이라는 사회적 인식을 가질 필요가 있다"고 했다. 이어 “국민들에게 개인 의료정보 등을 활용해 공익적 결과를 도출할 수 있다는 신뢰를 확보하는 것이 무엇보다 중요하다"고 강조했다.

저작권자 © 히트뉴스 무단전재 및 재배포 금지