"방대한 신약 데이터로 배우던 FDA 심사관 시절은 화양연화"

"FDA·EMA, PK/PD 모델링 활용한 검증 핵심 근거로 인정" "FDA, p-value 만을 판단 기준 삼지 않고 '증거의 종합성' 함께 고려"

2025-12-04     황재선 기자

 히터뷰  이지은 아레테볼로 대표 / 미국 FDA 전 심사관

미국은 세계 최대 의약품 시장으로 글로벌 시장 진출의 관문이다. 식품의약국 FDA는 아주 까다로운 수문장이다. 임상개발 진입(IND filing)이나 신약 품목허가(NDA) 심사에서 FDA 의도를 정확히 파악하는 것이 어렵기 때문이다. <히트뉴스>는 FDA서 임상약리ㆍ계량약리 심사관으로 10년간 커리어를 갈고 닦은 이지은 아레테볼로 대표를 만나 효율적인 신약개발 전략을 듣는다.

① 치열한 토론의 연속, 피와 살이 된 FDA 커리어 10년 
② FDA는 무조건 어렵다? 효율적 신약개발 전략 수립 필요
③ 글로벌 신약개발 지연은 혁신의 부재 탓? 다른 측면 존재 

이지은 아레테볼로 대표(가운데)는 FDA 근무 시절 노바티스의 자가면역질환 치료제 '코센틱스' 심사 공로로 포상을 받았다.

이지은 대표는 서울대 약학대학을 졸업하고, 미국 미네소타 대학에서 신약개발 관련 분야인 약제학 박사 과정을 마치고 보스턴의 버텍스 제약(Vertex pharmaceuticals)에서 계량약리 연구원(Pharmacometrician)으로 활동했다. 이후 미국 식품의약국(FDA)로 이직해 약 9년 6개월 동안 임상약리/계량약리 심사관으로 근무했다.

2019년부터 GC녹십자, LG화학에서 약 5년 간 근무한 후, 현재 미국과 한국을 왕래하며 서울아산병원, 울산대 의대 연구교수로 전공의와 대학원생을 대상으로 강의하던 중 2024년 미국 메릴랜드에서 컨설팅 업체 '아레테볼로(Aretevolo)'를 설립했다. 

아레테볼로는 미국 시장 진출을 목표로 하는 기업을 대상으로 한 R&D 컨설팅 회사로, FDA를 대상으로 하는 인허가 전략(Regulatory Strategy), 규제 미팅(Regulatory Meetings), 임상 약리(Clinical Pharmacology), 모델 기반 신약 개발(Model-informed Drug Development), 인허가 CMC, 임상 데이터 관리(Clinical Data Management) 등의 업무를 지원하고 있다.

이지은 대표는 울산대 의대 아산병원 겸임교수, 한국보건산업진흥원 글로벌 제약 전문가(GPKOL), 식품의약품안전처 글로벌 전문가 자문위원으로도 활동하고 있다. 

 

제약회사에서 첫 경력을 시작했고, FDA 심사관으로 옮겨 갔습니다. 무엇이 FDA로 이끌었나요?

이지은 아레테볼로 대표가 히트뉴스를 방문해 인터뷰에 응했다.  

"박사 과정 후 처음 재직했던 버텍스 제약은 신약개발에 약동학/약역학적(PK/PD) 모델링을 적용하는 데 있어 상당히 실력이 좋은 기업 중 하나였습니다. 계량약리 분야에서 진행하는 모델링은 주로 PK/PD 데이터를 기반으로 다양한 임상 결과를 예측하는 작업이었습니다. 이 방법은 적정 용량을 찾을 때 매우 유용하고, 약효와 안전성 예측에 있어 불확실성을 줄이고 예측력을 높이는 역할을 합니다.

버텍스에서 2개의 임상시험을 리드하면서 임상개발에 관해 많은 것을 배웠습니다. 당시에는 경험이 부족해 신약개발 전 과정을 충분히 이해하지 못했고, 과학적 이슈를 논의할 때마다 많은 질문이 뒤따랐습니다. 그런데 누군가가 'FDA가 원한다'거나 '원하지 않는다'는 한마디를 하면, 그 말로 논의가 단번에 끝나버리는 상황을 자주 보았습니다.

당시 신약개발 초심자로서, FDA가 특정한 데이터를 왜 '원하는지' 혹은 '원하지 않는지' 이해하고 싶었고, 그에 관해 선배들에게 질문하면 마땅히 명료한 설명을 듣지 못할 땐 답답해하기도 했지요. 선배들 조언에 따라 FDA 가이던스를 읽어보면 조금 도움이 되기도 했지만, '왜?'에 대한 답을 스스로 찾을 만큼의 제 이해도는 부족했던 것 같습니다. 

FDA 가이던스는 대부분 과학적 근거에 기반해 작성됩니다. 그 가이던스가 어떻게 만들어지고 집행되는지를 직접 보게 된다면, 외부에서는 이해하기 어려운 부분들을 더 깊이 이해할 수 있을 것 같았습니다. 그래서 직접 보고 배우고 싶다는 마음으로 FDA 심사관에 도전했습니다."

 

FDA에서 근무 해보니, 어떤 점이 좋았나요?

"매년 수십 개의 신약이 출시되고 수백 개의 신약이 임상에 진입하는 가운데, FDA로 쏟아지는 방대한 데이터를 접하는 일상은 그야말로 배움의 연속이었습니다. 매일 새로운 것을 공부하게 하는데, 월급까지 주니 이보다 좋은 직업은 없다고 생각했어요. 저는 늘 배우고 성장하는 삶이 가장 행복하다고 믿는데, 그런 점에서 FDA 시절은 제 인생의 '화양연화(花樣年華 )'였습니다.

특히 저와 같은 열정과 사명감으로 일하던 상사와 함께한 마지막 7년이 가장 행복했습니다. 그는 밤이고 낮이고 주말도 가리지 않고 언제든 전화해 질문하고 토론하던 일벌레 상사였지만, 저는 그 열정이 오히려 존경스러웠습니다. 모든 심사관이 그렇게 일하지는 않았지만, 그런 동료들과 함께 일할 수 있었던 것은 제게 큰 행운이었습니다.

심사 과정에서는 각 분야의 전문가들과 함께 논의해 의사결정을 내리기 때문에, 다양한 전문성에 대해 깊이 있는 배움의 기회가 컸습니다. 특히 특정 질환에 정통한 의학 심사관과 통계 심사관들에게서 많이 배웠습니다. 당연히 의견 차이로 부딪칠 때도 있었지만, 서로의 전문성을 존중하며 치열하게 고민하며 최선의 결정을 도출하려던 모습에 감동받곤 했습니다. 

대부분의 회의가 '무엇이 가장 중요한 이슈인가'를 중심으로 논의되기에, 매우 높은 수준의 과학적인 토론이 이뤄졌습니다. FDA를 떠난 후 가장 그리운 것도 바로 그 치열한 토론 문화입니다.

또, 계량약리 심사 업무의 특성상 독립적인 분석이 가능했다는 것도 좋았습니다. 회사가 제출한 원자료(raw data)를 직접 분석해 검증하고, 어떤 해석이 환자에게 더 이로운지를 판단하는 과정에서 공공의 봉사자로서의 사명감, 즉 '서번트 리더십(servant leadership)'을 실감할 때 가장 좋았습니다. 

대부분의 글로벌 제약사는 모델링 수준이 높아 심사관이 그들의 보고서를 통해 오히려 배울 때가 많지만, 일부 회사의 모델링은 완결성이 떨어져 의사 결정을 오도하는 경우도 있습니다. 때로는 상업적인 동기로 환자에게 최적의 조건을 마련하는 데 소극적인 경우도 있어요. 그런 상황에서 심사관이 독립적으로 이를 분석해 더 나은 결론을 이끌어낼 때, 환자에게 실질적 도움을 주는 역할을 했다는 점에서 보람을 느꼈습니다."

 

PK/PD 모델링 분야를 전문적으로 심사를 하셨어요. 심사자의 눈은 투여 용량 설정, 용량 최적화 등에 초점이 맞춰져 있는 걸까요?

"말씀하신 내용이 포함하지만 그에 국한되지는 않습니다. 저는 통계 심사관과는 다른 접근으로 약효와 안전성을 평가하는 데이터를 검토하는 심사 업무와 더불어 임상시험 디자인에도 관여했습니다.

특히 희귀질환의 경우, 질환의 특성과 진행 양상을 깊이 이해하는 의학 심사관이 주요 임상 결과 (primary clinical outcomes)를 결정하고, 이를 정량적으로 평가하는 과정에서는 통계 심사관과 계량약리 심사관이 핵심적인 역할을 담당합니다. 

비만이나 당뇨처럼 환자군이 넓은 질환에서는 통계적 유의성이 필수적이지만, 희귀질환이나 항암제와 같이 모집단이 제한적인 경우에는 통계적인 유의성을 확보하기 어렵습니다. 이럴 때 계량약리적 접근이 약효를 입증하는 핵심적인 도구가 되는데, 농도-반응 상관관계(exposure-response relationship)는 통계적 유의성을 확보하기 어려운 상황에서 약효를 뒷받침하는 주요 근거로 활용될 수 있습니다.

이 과정에서 p-value 중심의 전통적 통계 접근에서 벗어나, 데이터의 맥락과 임상적 유의성을 함께 고려하는 방향으로 발전해 왔습니다. ‘p-value<0.05’라는 기준을 기계적으로 적용하는 관행은 이미 오래전부터 재검토되고 있는데, 표본 크기(sample size)가 커질수록 그 값이 작아지는 특성에도 불구하고 그 의미가 과도하게 해석되어 온 탓입니다. 

오늘날 FDA는 p-value를 단독으로 하여 판단 기준으로 삼지 않고, 임상적 유의성과 증거의 종합성(totality of evidence)을 함께 고려하는 접근을 중시하고 있습니다. 이는 p-value의 유용성을 부정하는 것이 아니라, 효과 크기(effect size)의 임상적 의미와 연구 맥락을 통합적으로 해석해야 한다는 방향으로 나아가고 있음을 보여줍니다.

전통적 통계학이 무작위성(randomness)을 전제로 한 추론(inferential statistics)을 중심으로 한다면, 계량약리학에서는 기존 지식과 축적된 데이터를 반영하는 배이시안(Bayesian) 사고방식을 적용합니다. 이를 통해 불확실성이 큰 상황에서도 보다 일관된 의사결정을 가능하게 합니다. 예컨대, 약물 농도가 증가할수록 약효가 커지는 일관된 패턴이 관찰된다면, 이는 통계적 검증 여부와 관계없이 약효를 지지하는 강력한 근거가 될 수 있습니다. 

이러한 계량약리학적 모델링은 무작위화가 어려운 상황에서도 교란 요인(confounding)의 영향을 정량화하고, 시뮬레이션을 통해 불확실성을 보완할 수 있다는 점에서도 강점을 지닙니다. 특히 초기 항암 임상이나 희귀질환처럼 환자 수가 제한된 상황에서는, 통상적 통계 방법만으로 충분한 검증력을 확보하기 어렵기 때문에 PK/PD 모델링이 비용 효율적이면서도 과학적으로 타당한 대안이 됩니다.

최근에는 FDA와 EMA 등 주요 규제기관이 이러한 접근을 과학적 판단과 의사결정을 뒷받침하는 핵심 근거로 삼는 경향이 더욱 강화되고 있습니다."

 

FDA 심사관에게 언제, 어떤 느낌의 보람이 찾아 왔나요?

"신약의 승인 여부뿐 아니라 출시된 신약이 환자에게 최선의 혜택을 제공할 수 있도록 기여할 때, 가장 큰 보람을 느낍니다. 

제약회사는 약효와 안전성뿐 아니라 생산과 공급의 효율성, 상업성 등도 함께 고려하며 신약을 개발합니다. 이는 너무나 당연한 일이지요. 그러나 생산성과 효율성을 지나치게 중시하다 보면 상대적으로 소홀히 다뤄지는 환자 집단이 생깁니다. 대표적인 경우가 소아 환자이며, FDA에서 '특수 환자군(specific populations)'이라 부르는 노인, 간질환자, 신장질환자 등도 이에 해당합니다. 이들은 약물의 작용 양태가 달라 특별한 주의가 필요한 환자들입니다. 이러한 환자들을 위한 적절한 조치와 대안을 마련할 때 가장 큰 보람을 느낍니다.

어떤 약물은 체중에 따라 약동학적 특성이 달라집니다. 그 차이가 약효나 안전성에 영향을 미칠 정도라면, 체중을 고려해 용량을 달리 설정해야 합니다. 하지만 기업들은 이미 그런 데이터를 보유하고 있으면서도, 상업적 편의성 때문에 이를 무시하고 '승인을 받기에 충분한 약효'를 보이는 단일 용량을 모든 환자에게 적용하려는 경우가 많습니다.

노바티스가 개발한 IL-17A 억제제 코센틱스를 심사할 때가 그런 사례였습니다. 체중이 훨씬 높은 환자들, 특히 해당 적응증(판상 건선)에서 중증 환자일 가능성이 큰 집단에 대해, 용량을 50% 증대했을 때 약효는 향상되고 부작용은 증가하지 않는다는 점을 시뮬레이션 데이터로 설득했습니다.

그 결과 회사는 허가 후 임상(Post-Marketing Commitment)으로 이를 검증하기로 합의했고, 실제로 추가 임상시험 결과 제 시뮬레이션이 옳았다는 것이 입증됐습니다. 그 공로로 상도 받았고 아마도 제 FDA 경력 중에서도 가장 임팩트 있는 사례가 아닐까 싶습니다."

 

피와 살이 됐을 규제기관의 경험을 갖고 다시 산업계로 돌아왔을 때 넓어진 지평은 개별 회사에게 어떤 도움으로 다가 갔나요?

"당연히 피와 살이 되어 큰 힘이 되었지만, 때로는 독이 되기도 했습니다. FDA 심사관 경험이 미국 진출을 희망하는 기업에 도움이 되리라 기대했지만, 실제로 얼마나 도움이 될 수 있을지 확신하기는 어려웠습니다.

2018년 귀국을 결심했을 때, FDA 승인 문턱에서 두 차례 좌절한 국내 기업을 돕고 싶은 마음이 컸습니다. 제 경험이 그들의 글로벌 도약에 조금이라도 보탬이 된다면 충분히 의미 있는 일이라 여겼습니다. 마치 군 입대 영장을 받은 듯 설명하기 어려운 감정에 휩싸인 채 고민하다, 진행 중이던 미국 시민권 심사도 뒤로하고 귀국했습니다. 

예상과 달리 제가 맡은 조직은 초기 연구 중심의 부서였습니다. 이미 한국의 R&D가 디스커버리(discovery)에 치중돼 있다는 걸 알고 있었지만, 개발 단계의 프로젝트가 거의 없는 조직을 이끈다는 건 또 다른 도전이었지요. 이 조직은 일라이 릴리의 코러스(CHORUS)를 벤치마킹해, 스위트 스팟(Sweet Spot)인 임상 1상 시점에 과제를 종합 평가하는 모델을 따랐습니다. 기대와 설렘이 컸지만, 대부분의 과제가 스위트 스팟까지 도달하기까지 수년을 기다려야 하는 현실이었습니다. 

FDA에서 후기 임상까지 경험했던 덕에, 초기 데이터를 보다 더 냉정하고 정성적으로 평가할 수 있었습니다. 연구원들과 함께 초기 신호를 분석하고, 개발 단계로 넘어갔을 때 예상되는 한계를 현실적으로 판단하도록 돕는 과정은 큰 의미가 있었습니다.

연구원들은 전략적 시각을 키워갔고, 저 역시 초기 연구자들의 고민을 더 깊이 이해할 수 있었습니다. 환자를 위해 신약을 개발하겠다는 연구원들의 진심과 열정은 지금도 제 기억에 깊이 남아 있습니다.

하지만 FDA에서 임상에 진입했거나 후기까지 살아남은 약물들을 주로 평가했던 제 경험이 아이러니하게도 때로는 '독'이 되기도 했습니다.

회사의 대부분 프로젝트는 임상 문턱에도 이르지 못하고 사라지는데, 지극히 자연스러운 일입니다. 될성부른 과제일수록 빨리 중단하는 것이 전체 포트폴리오를 건강하게 만들기에, 신속한 의사결정이 아주 중요하고요.

그러나 연구자들에게는 하나의 프로젝트가 자신의 '작품'이자 '자식'과도 같습니다. '이건 개발하기 어렵습니다'라는 제 한 마디가 팀의 사기를 꺾고 마음을 다치게 할 수 있다는 것을 그때 알았습니다. 냉정함이 필요한 자리였지만, 동시에 공감의 리더십이 얼마나 중요한지도 그때 배웠습니다.

이후 다른 회사로 옮겨 임상 단계 과제에 관여할 때는 FDA 경험이 실무에 직접적인 도움이 됐습니다. 기존 데이터를 활용해 원숭이 시험 면제를 받아내거나, 2상에서 평가하지 않았던 고용량을 3상에서 승인받은 최초의 사례도 만들었죠. 특히 모델링을 통해 기존보다 높은 용량을 정당화한 것은 국내에서는 처음, 미국에서도 드문 사례였습니다. 고용량에서 약효가 강화되면 시장 경쟁력과 상업적 가치가 함께 높아지는 것은 자연스러운 결과였습니다. 

그런데 아이러니하게도, 이렇게 명백히 이로운 일을 두고 FDA를 설득하는 것보다 더 어려운 건 내부 설득이었습니다. 비단 모델링 접근뿐 아니라 규제 원칙과 관련된 몇몇 사안에서도 예상치 못했던 조율의 어려움이 있었습니다.

제게는 자명했던 논리가, 그런 경험이 없는 사람들에게는 낯설고 위험하게 들렸을 수도 있어요. 그 차이를 이해하지 못한 채 답답함을 느끼고, 때로는 조직의 성과에 대한 확신이 흔들리기도 했지요. 제 의도와는 달리, 서로 다른 이해관계가 얽힌 상황을 충분히 고려하지 못하면, 어떤 사람들에게는 'FDA 경력'이 권위적으로 느껴지거나 제가 답을 이미 정해놓은 사람처럼 보일 수 있다는 걸 나중에서야 알았습니다.

'그들도 실패를 통해 배우도록 두라'고 조언하는 사람도 있었지만, 저는 명백해 보이는 실패를 막으려는 마음이 앞섰고, 돌이켜보면 그 마음이 오히려 '독'이 됐던 것 같습니다."