특별기고 |
한국의약연구소 양정수 박사의 FDA 눈 높이와 바이오분석

 FDA 규정 준수를 위한 생체시료 분석법의 개발, 검증 및 시료의 분석  [2]

양정수 박사
양정수 박사

미국과 국내에서 regulated (GLP) bioanalysis CRO에서 근무한 경력을 통해 가지고 있는 경험과 지식을 바탕으로 "FDA 규정 준수를 위한 생체시료 분석법의 개발, 검증 및 시료의 분석(Bioanalytical method development, validation, and sample analysis for FDA compliance)"에 대해 요약적으로 기술하고자 한다. 국내에서 chromatographic calibration (cc) 및 ligand binding assay (LBA), 그리고 이와 관련하는 분야에서 종사하는 업계관계자들께, FDA가 중요하게 간주하는 사항들뿐만 아니라, 미국과 국내 간 차이와 더불어 국내의 일부에서 부적절하게 인식하고 실시하는 사례 몇 가지도 소개함으로써 신뢰성이 보장된 실제시료 분석 결과의 보고 (analytical report)가 Sponsor와 FDA에 성공적으로 제출되고 통과되는데 도움이 되고자 한다. 3회에 걸쳐 연재한다.

 

분석의 개발과 분석의 검증 
Assay Development and Assay Validation

검증 (validation)은 완벽 (완전무결)하게 이루어져야 함에 따라 validation 전에 실시하는 개발 (development)은 매우 중요한 단계이다. 따라서 validation study binder뿐만 아니라, development study binder를 통해서도 development의 전체 과정, 데이터 및 결과에 대해 추적 가능하도록 기록되고 보관되어야 한다.

개발의 목적은 실제시료 분석에 적용할 분석법을 검증할 수 있는가를 확인하고자 함이며, 완전무결하게 검증을 실시할 수 있도록 검증될 분석법을 개발함을 목표로 하여야 할 것이다. 개발의 중요성은 종종 간과되기도 한다. 개발은 준검증 (quasi-validation)의 수준까지 도달할 수 있으며 검증에서는 필수적이지 않으나 개발 과정에서 관찰되는 이슈를 확인하고 이를 개선하기위해 회수 (recovery)과 고전적인 검증 (traditional validation)으로서의 매트릭스 영향 (matrix effect) 등과 같은 항목들이 평가될 수도 있다.

부실한 개발이 실제시료 분석의 실패로 이어질 수 있는 대표적 예로서, calibration standard curve의 linearity 및 calibration standards를 대상으로 accuracy (expressed as bias)와 precision (expressed as coefficient of variation)를 평가하는 경우가 있으며, 또는 calibration standard curve로부터 계산된 QCs 농도데이터를 가지고 accuracy와 precision을 평가하는 것만으로 개발을 완성하는 경우 등을 들 수 있다.

개발 단계에서 필수 (중요) 항목 중 하나로서 안정성의 평가를 개발단계에서 빼놓을 수 없는 이유는, 종종 안정성 이슈가 임상/비임상 시험, 검증 또는 실제시료 분석에서의 실패에 대한 주요한 원인이 되기도 하기 때문이다. 개발 시 평가하는 안정성 항목들은 검증 시의 항목들 중 장기안정성만을 제외하기 때문에 거의 온전한 (nearly full) 안정성 평가라고 할 수 있는데, 이 때 비록 장기안정성 평가의 대체가 될 수는 없으나 사용조건보다 높은 온도 등의 조건을 적용하여 안정성을 평가하는 방법인 소위 가속화된 단기안정성 (accelerated short-term stability) 평가를 통해 추후 검증 시의 장기안정성 결과를 대략적으로 예상할 수 있다.

검증의 목적은 검증된 분석법을 실제시료 분석에 적용할 수 있는가 확인하고자 함이며, 완전무결하게 실제시료 분석을 실시할 수 있도록 실제시료 분석에 적용될 분석법을 신속하고 정확하게 (통상 3-4일내) 검증함을 목표로 하여야 할 것이다. 검증 단계에서의 요구되는 주요 주의사항으로서, (1) 적어도 3번 (정확성의 경우에는 최소 5번)의 유효한 반복측정으로부터 얻는 평균 (mean)을 가지고 평가하여야 하는데 이 때 그 평균에 대한 변동계수 (coefficient of variation)가 오직 허용범위 (acceptable range) 이하일 때의 평균만이 평가에 사용될 수 있으며, (2) 미지의 실제시료가 존재하지 않기 때문에 검증에서 재분석은 성립하지 않는다.

정확성 (accuracy), 정밀성 (precision), 감도 (sensitivity)는 검증의 필수 항목으로서 1번의 실행 (run)만으로 검증되지 않는다. 따라서 적어도 3번의 독립적이고 유효한 연속적인 정확성과 정밀성 실행 (at least three independent and consecutive A&P runs)을 통해 허용기준을 충족하는 (정밀성이 뒷받침된) 정확성을 평가할 수 있어야 한다. 정확성과 정밀성은 최소 3가지 다른 농도수준의 QCs를 가지고 각각 bias와 coefficient of variation로서 표현된다. 감도는 정량하한 (lower limit of quantification, LLOQ) 수준의 QCs를 가지고 bias로서 표현되는데 이 때, coefficient of variation가 허용범위 내에 있지 않는 평균농도는 bias를 계산하는데 이용될 수 없음에 따라 감도를 평가할 수 없다.

주의 사항으로서, lowest calibration standard를 대상으로 감도를 평가하지 않으며, LLOQ QC에 대해 측정하는 signal-to-noise와는 무관하게 그 (적어도 3번의 독립적이고 유효한 연속적인) bias가 하용범위 내에 있지 않는다면 분석의 감도는 평가되지 않는다.

선택성 (selectivity)은 blank 및 LLOQ 수준에서, 매트릭스영향 (matrix effect)은 저농도 (low concentration) 및 고농도 (high concentration) 수준에서 각 QCs의 정확성 (bias)를 평가함으로써 검증한다. Selectivity와 matrix effect의 세부항목으로서, lot-to-lot variation, 용혈 (hemolysis), 지질혈증 (lipemia), 특정성 (specificity) 등을 들 수 있다. 실제시료 분석 시, 오직 하나의 subject를 대상으로 하지는 않음에 따라, 그리고 그 subject blank를 QCs 조제 시 matrix로 사용하지 않음에 따라 lot-to-lot variation은 검증의 필수항목이 된다. 실제시료가 용혈 또는 지질혈증과 무관할 것이면 이들 항목들은 검증으로부터 제외될 수 있다.

실제시료 중에 분석물질 외 (예를 들어 대사체, 병용투여 및 복합제재 등과 같이) 다른 특정한 물질이 포함되어 있다면 그 특정물질이 분석물질 농도측정의 정확성에 영향을 끼치지 않음을 검증하여야 할 것이다. 한편, 이와 같이 별도로 특정성을 검증하기보다는, 특정물질이 분석물질과 함께 포함되도록 조제된 QCs (이 때 calibration standards에는 분석물질만을 포함)를 대상으로 검증을 온전히 실시하는 것이 더 타당하다. 

검증이 아닌 개발 단계에서 고전적인 검증 (traditional validation)으로서의 매트릭스 영향 (matrix effect)에 대한 조사가 필요할 경우가 있다. 이는 처리 후 투입된 (post-processing spiked) 시료와 처리하지 않는 (unprocessed) 시료 간의 비교로부터 평가할 수 있는데 그 결과를 통해 예상 (목표)으로부터 훨씬 낮은 감도 (LLOQ)의 원인이 매트릭스영향에 의한 이온화의 저하 (ionization suppression)일지 그 여부를 확인하고 시료처리 방법의 변경 (further purification, more dilution, etc) 또는 LC 조건변경 등의 시도될 수 있을 것이다.

회수 (recovery)는 처리된 (processed) 시료와 처리 후 투입된 (post-processing spiked) 시료 간의 비교로부터 평가한다. 회수의 대표적인 예로서는 추출효율 (extraction efficiency), 반응효율 (reaction efficiency), 및 여과효율 (filtering efficiency) 등을 들 수 있다. QCs가 실제시료를 충분히 대리 (surrogate)하고 (즉 동등하게 조제되고 처리 및 기기분석되고) 이러한 QCs를 통해 accuracy (assessed with the mean that coefficient of variation is within the acceptable range)와 sensitivity (LLOQ)가 평가되었다면, 회수는 분석검증의 필수항목이 아니며 회수율이 100%일 필요도 없다. 회수를 개발 단계에서 조사함으로써 회수가 정확성에 끼치는 영향을 평가하는 예로서, 예상으로부터 훨씬 낮은 감도 (LLOQ)가 관찰되었거나 calibration standard curve의 선형성 (linearity) 또는 QCs의 정확성이 농도에 의존하여 벗어나는 현상 등이 관찰되는 경우를 들 수 있다.

그러나 비록 바람직하지 않으나 불가피하게 QCs가 실제시료를 대리할 수 없다면 개발 단계뿐만 아니라, 검증 시 그리고 실제시료 분석의 모든 각각의 분석실행 (analytical run)에서 회수에 대해 평가하여야 할 것이다. 하나의 예로서, 실제시료와는 다르게 QCs는 분석물질의 화학적 (chemical) 또는 효소적 (enzymatic) 반응 후의 생성될 표준물질이 투입되어 조제된 것이라면, 실제시료 농도를 포괄하는 적어도 3가지 이상의 서로 다른 농도에서의 평균회수율 (the mean recovery that coefficient of variation is within the acceptable range)을 구한 후 이를 correction factor로서 실제시료 농도데이터에 적용하여야 할 것이다. 

검증 단계에서 안정성을 평가하기에 앞서, 개발 단계에서 장기안정성을 제외한 모든 안정성을 평가하여 얻은 결론을 미리 가지고 있는 것이 바람직하다. 모든 각각의 안정성을 평가하는 이유는, 실제시료 분석 시 사용될 표준물질용액 (standard solution), 내부표준물질용액 (internal standard solution), 실제시료와 더불어 이를 대리 (surrogate)하는 QCs, 채집 (채혈 또는 집뇨)될 실제시료의 보관조건 (용기재질, 흡착방지제, 안정화제, 차광 등)에 따른 유효기간(시간)을 결정한 후 이를 실제시료분석에 적용(준수)함으로써 실제시료의 대리인 QCs를 항상 실패없이 정확하게 분석할 수 있으며 또한 이를 바탕으로 실제시료의 분석을 신뢰할 수 있기 때문이다. 

안정성을 평가하는 디자인으로서, control (즉 Time zero)과 더불어 보관시간 외 다른 보관조건은 control과 완벽하게 동일한 것으로서 control 대비 최소 2개의 서로 다른 시간동안 보관한 test를 준비하되, 이들 모두 반드시 하나의 검증실행 (validation run)내에 포함되도록 하여 얻는 데이터 (peal area or peak area ratio)를 상호 비교 (difference)한다.
최소 4개의 농도 수준 (blank, LLOQ, low and high)에서 평가하는 선택성과 매트릭스영향과 최소 3개의 농도수준 (low, medium, and high)에서 평가하는 회수와는 달리, 안정성을 최소 2개의 농도수준에서 평가하는 이유는, 그 평가가 정확성을 기반으로 하지 않고, 안정성 비율 (stability ratio)을 correction factor로서 실제시료 농도데이터에 적용하지 않으며, 불안정은 일관된 추세로써 입증되어야 하기 때문이다 (A consistent trend should be demonstrated to be unstable).

또다른 디자인인 정확성을 기반으로 하는 안정성 평가 시 유의할 사항으로서, 하나의 실행 (run)에서 즉, 하나의 calibration standard curve로부터 역계산하여 얻는 test (without control) 농도의 정확성을 가지고 안정성에 대한 결론을 도출할 때, 때로는 안정함에도 불구하고 불안정하다거나 또는 불안정함에도 안정하다는 에러 위험의 가능성을 신중히 검토하여야 할 것이다. 또한 2개이상의 (서로 다른 보관시간의) test를 하나의 실행에서가 아닌, 각각 별도의 실행을 통해 그 정확성을 평가하는 경우에도 역시 calibration standard curve variation으로 인해 안정성 평가 에러 가능성을 유의하여야 한다. 한편, 농도계산을 위한 calibration standard curve equation의 유효성을 QCs가 결정하기 때문에 해당 안정성검증실행을 QCs 없이 calibration standard curve과 test로만 구성해서는 안된다. 만일 QCs가 허용기준을 충족하지 않아 해당 실행이 실패한다면 test의 역계산된 농도데이터가 bias 계산하는데 사용될 수 없으며 안정성을 다시 평가하여야 한다.

통상적으로 standard stock solution stability와 standard working solution stability는 검증의 필수항목이 되지만 만일 그 solution을 조제하지 않거나 직접 그 solid (powder)를 사용하여 고농도 QCs를 조제한 후 다시 이를 blank matrix로써 serial dilution하여 조제한 QCs를 사용하거나, 또는 그 solution을 조제 및 사용 후 보관하지 않고 항상 새롭게 조제하여 사용하는 경우에는 비필수항목이 될 수도 있다. 그러나 그럼에도 불구하고 실제시료 분석 (i.e., analytical study)가 끝날 때까지는 적어도 사용하는 QCs의 로트 (lot)가 변경되지 않아야 할 것이며 만일 도중에 새로운 QCs의 조제가 불가피할 경우에는 항상 QCs 로트변화에 따른 lot-to-lot variation이 실제시료 분석의 정확성뿐만 아니라 일관성 (consistency)에 끼칠 수 있는 영향을 확인하고 통제하는 것이 중요하다. 비단 용액의 보관기간 뿐만 아니라, 용액의 사용 횟수 (피펫팅, 보관온도와 실온 간의 cycle 등)도 안정성 (유효기간)에 영향을 끼칠 수 있으므로 이에 대한 평가도 포함하여야 할 것이다.

만일 internal standard working solution에 대해 within-run variation이 존재할 때, 이것은 실제시료 분석실행의 실패 (analytical run fail)로 이어지기 때문에 internal standard working solution short-term stability의 평가는 필수적으로 이루어져야 한다. 반면에 run-to-run variation과 관련이 있는 internal standard stock solution stability 및 internal standard working solution long-term stability를 평가하지 않는 이유는, 모든 각각의 분석실행 내에서 실제시료와 함께 QCs도 처리하고 기기분석함에 따라 그러한 variation이 실제시료 분석의 정확성과 일관성에 영향을 끼치지 않기 때문이다.

Matrix (e.g., plasma, urine, etc) stability는 세부적으로 단기 (short-term)보관, 장기 (long-term)보관, 냉해동주기 (freeze/thaw cycle)보관의 안정성으로 구성된다. 실제시료의 재분석 (reassay) 또는 incurred sample reassay (ISR)울 실시하는 한, 실제시료의 채집 (collection) 후 보관기간 없이 곧바로 분석하는 것은 불가능하기 때문에 이러한 안정성들을 필수적으로 평가하여 결정된 유효기간을 실제시료 분석에 적용하여야 한다.

단기보관과 냉해동주기보관 안정성평가 시, control과 test는 서로 보관기간만 달리할 뿐, 동시에 (하나의 로트로서) 조제하고 동시에 (하나의 실행 내에서) 처리하고 기기분석할 수 있는 반면에, 장기보관 안정성 평가를 위한 control과 test 간에는 조제의 lot-to-lot variation이 불가피한데 이러한 variation이 잘못된 결론 (false positive as well as false negative)으로 이어질 수 있음을 유의하여야 할 것이다. 그러한 variation을 최소화하기 위해 유효기간 내 있는 그리고 그 로트가 (test 대비) 변경되지 않은 standard working solution과 blank matrix를 이용하여 control를 조제하여 이를 test와 비교하는 방법이 제안될 수 있다. 한편 internal standard로서 stable isotope-labeled (SIL) analyte를 control과 test에 투입함으로써 얻는 peak area ratio data를 평가에 이용한다면 blank matrix lot 차이와 이로 인한 response차이에 의한 장기안정성 평가의 에러 발생을 피할 수 있다. 

처리된 시료의 안정성 (processed sample stability)으로는 처리 후 안정성 (post-preparative stability) 및 주입 재현성 (injection reproducibility)이 포함된다. 이들 안정성은 실제시료 분석 시 적용하지 않는다면 검증의 필수항목에 포함되지 않는다. Post-preparative stability가 실제시료 분석에 적용될 때 별도로 새롭게 조제되는 calibration standard curve equation에 의해 역계산되어 얻는 (실제시료의 실행 내의) QCs 농도가 허용기준을 충족하여야 할 것이며 이외에도, LLOQ QC가 분석실행 내에 포함되어 있지 않다면 (즉, low QC가 최저 QC인 경우에) 비록 분석실행이 통과하였다 하더라도 LLOQ와 low 농도범위에서의 calibration standard, QCs, 그리고 실제시료 간의 signal-to-noise를 비교하고 이것이 실제시료 분석에 끼칠 수 있는 영향을 검토하여야 할 것이다. 주입재현성이 실제시료 분석에 적용될 때 비록 검증 시 확인된 안전성 기간에 비해 초과되었다 하더라도 QCs가 허용기준을 충족하여 실행이 통과한다면 그 실행 내 QCs가 대리하는 실제시료의 농도데이터를 보고할 수 있다.

희석의 타당성 (dilution integrity or dilution linearity)은, 실제시료 분석 시 적용하지 않는 한, 검증의 필수항목에 포함되지 않는다. 희석의 타당성은 AQL QC를 공매트릭스 (blank matrix)로 희석하거나 또는 처리된 공시료 (processed blank+internal standard)로 희석하는 두가지 방법이 있으며, 각 방법이 accuracy와 variation에 끼치는 영향을 반영할 때 후자인 처리된 공시료를 이용하는 방법을 실제시료 분석에 적용하는 것이 더 선호될 수 있다. 비록 검증에서 희석타당성을 포함하지 않았다 않더라도 실제시료 분석 시 해당 분석실행 내에서 AQL QC에 대해 그 정확성이 허용기준을 충족하여 평가된다면 AQL QC와 동등하게 희석한 실제시료의 결과는 보고할 수 있다. 그러나 비록 AQL QC의 평균농도뿐만 아니라 각각의 모든 농도가 허용범위 내 있음으로 희석의 타당성이 평가되었다 하더라도, 실제시료의 희석 분석 수를 최소화하는 것이 요구된다.

실행 또는 배치의 사이즈 (run or batch size)는 검증의 필수항목은 아니며, 필요시 분석의 개발 단계에서 그 사이즈가 분석의 정확성에 끼치는 영향 유무를 확인할 수 있다.  실제시료 분석 시, 그 사이즈를 평가했을 때의 사이즈를 초과하더라도, 그 분석실행이 통과 (QCs meet the acceptance criteria)한다면 실행 내 실제시료의 데이터는 보고할 수 있다. 실행 (run)과 배치 (batch)는 구별되어야 한다. 하나의 실행 내에는 1개 이상의 배치가 포함될 수 있다. 하나의 실행에는 a single calibration standard curve (constructed with two replicates of each standard)가 포함되며, 하나의 배치 내에서는 최소 두 반복의 QCs (at least two replicates of each)가 실제시료를 포괄하도록 한다. 두개의 배치로 구성되는 하나의 실행에 대한 예로서, 2인의 분석자가 하나의 실제시료 분석실행을 실시 즉, 시료의 해동과 처리를 나누어 실시하는 경우 및 하나의 분석실행을 위한 실제시료를 2개의 solid-phase extraction (SPE) plate로 나누어 처리하는 경우 등을 들 수 있다.

실행 또는 배치 사이즈는 단순히 (분석기기로의) 주입(검출)사이즈만을 의미하지 않으며 실제시료와 QCs의 해동, 처리, 주입읕 통한 데이터 획득까지를 포함하는 분석의 전체 단계의 사이즈를 의미함을 유의한다. 따라서 검증 시 주입의 사이즈에서는 실행의 실패 (run fail)와 같은 이슈의 발생이 관찰되지 않았으나 실제시료 분석 시에는 종종 발생하는데, 이는 해동과 처리 과정에서 놓친 분석이슈 (주로 안정성)가 실행실패의 원인이 될 수 있다.

온전한 검증 (full validation)이란, 정확성을 온전히 보장하기 위해 실제 시료 분석에 적용하여야 할 모든 필수적 검증항목들을 평가함을 의미하며 일부 검증 (partial validation)은, 온전한 검증 후 실제시료 분석의 방법과 조건 그리고 보관 등에 발생한 변화에 따라 (온전한 검증까지는 요구되지 않으며) 단지 필수 검증항목 중 일부를 추가로 평가함을 의미한다. 일부 검증은 그러한 변화가 발생하였음에도 불구하고 그러한 변화로 인한 일부 항목에 대한 검증만으로도 수정된 분석이 여전히 정확성을 가짐을 입증하거나 기존의 온전히 검증된 분석이 가지는 정확성에 끼치는 영향을 끼치지 않음을 입증하는 것을 목적으로 한다.

따라서 항상 먼저 온전히 검증된 분석법이, 또는 요구 시 온전히 검증된 분석법에 일부 검증이 추가된 분석법이 실제시료 분석에 사용되어야 하며 기존에 온전히 실시된 검증 없이 처음부터 일부 검증된 분석법은 사용될 수 없다. 또한 기존에 분석이 온전히 검증되었음에도 불구하고 예를 들어 분석자의 변경 또는 검증과 시료분석 간의 상당한 차이의 기간 등이 일부 검증의 사유가 되지는 않는데, 그 이유는 온전한 분석의 검증은 분석자 또는 기간과는 무관하기 때문이다. 따라서 이런 경우에는, 일부 검증을 실시하는 대신 standard operating procedures (SOPs)에 따라 기 검증된 분석법 (already validated method)을 확인 (verification)한 후 실제시료 분석을 실시함으로써 분석실행의 실패 (analytical run fail)가 발생하지 않도록 한다. [7월6일자 계속]

 

 필자 양정수 박사는 

양정수 박사는 비임상, 임상 1~3상 등 임상 관련 전반적 서비스를 제공하고 있는 종합 CRO ㈜한국의약연구소 바이오사업부의 연구, 교육, 감독 및 성과 검토의 총괄관리 책임자로 근무하고 있다. 연세대학교에서 분석화학으로 박사 학위를 받은 양 박사는 27편의 연구논문과 1권의 저서, 1건의 유럽 특허를 갖고 있다. 

주요 약력

ㆍ2014년 2월 – 2019년 4월 TDM Pharmaceutical Research, Inc. – Newark, DE, United States Principal Research Scientist ( w/ Green card) 
ㆍ2010년 9월 - 2014년 2월 삼성서울병원 책임연구원 
ㆍ2009년 3월 – 2010년 8월 The University of Chicago – Chicago, IL, United States Research Professional Associate (w/ H1b visa) 
ㆍ2005년 4월~2007년 6월 LG생명과학 선임연구원
ㆍ2003년 4월 – 2005년 3월 National Institutes of Health – Bethesda, MD, United States Visiting Fellow, Post-doctoral (w/ J1 visa)

저작권자 © 히트뉴스 무단전재 및 재배포 금지