"AI 확대 속 GMP 현실은?… 기술 보다 규제·데이터 먼저 살펴야"

FDA·EU 등 '밸리데이션 확보' 공통 기준 제시
"현장선 활용 한계 여전…데이터 품질·DI가 핵심"

1일 고양시 킨텍스에서 열린 'sureGMP New Approach Seminar' 'GMP 환경에서 AI의 활용' 세션 현장. / 사진= 김동우 기자

제약·바이오 산업에서 인공지능(AI) 도입이 빠르게 확산하는 가운데 GMP 환경에서는 기술 활용보다 규제 충족이 우선시 돼야 한다는 제언이 나왔다.

박준규 인터페이스정보기술 대표는 1일 고양시 킨텍스에서 열린 'sureGMP New Approach Seminar'에서 ‘GMP 환경에서 AI의 활용'을 주제로 발표하며 AI 도입 시 규제 기준과 적용 한계를 중심으로 현장 활용 방향을 제시했다. 그는 특히 "GMP 영역에서 설명이 불가한 AI는 사용할 수 없다"며 기술 도입보다 밸리데이션 확보가 선행돼야 한다고 강조했다.

"GMP서 AI 활용 조건 엄격…밸리데이션 가능성 요구"

박 대표는 GMP 환경에서 AI 활용 전제 조건으로 밸리데이션 가능성을 가장 먼저 제시했다.

박 대표에 따르면 EU의 AI용 GMP 규정인 'Annex 22', 미국 FDA 등 주요 규제기관은 AI 활용 시 공통적으로 설명 가능성, 데이터 품질, 변경 관리 체계를 요구하고 있다.

특히 AI 모델의 형태도 제한된다. 박 대표는 "GMP에서 허용되는 AI 모델은 학습 이후 변경되지 않는 정적인 모델과 동일 조건에서 항상 같은 결과를 도출하는 결정적인 모델 두 가지"라며 "훈련 이후 모델이 변하지 않아야 하고 결과는 확률이 아니라 확정값으로 나와야 한다"고 설명했다.

이어 "적합일 확률이 85%라는 식의 결과는 허용되지 않고 반드시 적합 또는 부적합으로 명확히 나와야 한다"고 부연했다.

생성형 AI 활용 역시 엄격한 기준이 적용된다. Annex 22 기준에서는 대규모 언어 모델(LLM) 기반 생성형 AI를 GMP 의사결정에 직접 사용하는 것이 금지되며 지속적으로 학습하는 동적 모델이나 버전 관리가 불가능한 시스템도 적용이 어렵다고 박 대표는 설명했다.

그는 "챗GPT나 제미나이처럼 계속 업데이트되는 모델은 GMP 환경에서는 그대로 사용할 수 없다"며 "이와 같은 모델은 버전을 고정하고 변경 시마다 밸리데이션을 다시 수행해야 한다"고 말했다.

이와 함께 최종 의사결정 책임은 반드시 사람에게 있다는 점도 강조했다. 그는 "AI를 사용할 수는 있지만 최종 판단은 사람이 책임지는 구조가 기본 원칙"이라며 "AI가 어떠한 결과를 냈을 때 왜 그런 결과가 나왔는지를 설명할 수 있어야 한다"고 말했다. 이어 "결과 도출 과정을 설명할 수 없는 블랙박스 형태의 모델은 GMP 환경에서 적용이 어렵다"고 부연했다.

"AI 적용 핵심 요인은 데이터 품질과 DI"

박 대표는 규제 요건과 함께 데이터 기반 역시 AI 적용의 핵심 전제로 작용하고 있다고 설명했다.

그는 "MES, ERP, LIMS, QMS 등 다양한 시스템을 통해 방대한 데이터를 생성하고 있지만 이를 AI에 곧바로 활용하기에는 규제 요건을 충족해야 하는 부담이 존재한다"고 말했다. 사물인터넷(IoT) 기반 설비 데이터까지 포함되면서 데이터 규모는 기하급수적으로 증가하고 있으나 이 데이터가 통합되지 못하고 분산돼 있는 구조가 문제라는 것이다.

특히 데이터 품질과 데이터 인테그리티(DI) 기준을 충족하지 못할 경우 AI 학습 자체가 불가능하다. 박 대표는 "AI는 결국 데이터로 학습하는데 데이터 품질이 확보되지 않으면 결과도 의미가 없다"며 "가비지 인, 가비지 아웃 구조가 그대로 적용된다"고 설명했다.

그는 "현장에서 데이터를 계속 쌓고 있지만 실제로 의미 있는 정보를 뽑아내지 못하는 경우가 많다"며 "데이터 활용 전략 없이 AI만 도입하는 것은 효과를 기대하기 어렵다"고 말했다.

AI 도입을 위한 필수 요소로는 데이터, 알고리즘, 컴퓨팅 파워가 제시됐다. 이 가운데 데이터는 규정에 부합하는 형태로 축적돼야 하며 알고리즘 역시 결과 도출 과정을 문서로 설명할 수 있어야 한다는 것이 박 대표의 설명이다.

박 대표는 특히 컴퓨팅 파워를 주요 변수로 꼽았다. 그는 "데이터가 10만 건일 때와 100만 건일 때 정확도는 크게 달라진다"며 "대규모 데이터를 학습시키기 위한 하드웨어 자원도 필수"라고 말했다. 이어 "AI는 데이터, 알고리즘, 컴퓨팅 파워 세 가지가 모두 갖춰져야 제대로 동작하는 구조"라며 "이 중 하나라도 부족하면 기대한 성능을 내기 어렵다"고 부연했다.

박 대표는 "결국 현재 단계에서 AI는 의사결정을 대신하기보다는 검토를 보조하는 형태로 활용하는 것이 현실적"이라며 "자동화와 AI를 구분해 접근하는 전략이 필요하다"고 말했다.

AD 실시간 제약시장 트렌드, 데이터로 확인하세요. 제약산업을 읽는 데이터 플랫폼 BRP Insight

상단영역

본문영역