在藥物研發進程中,藥代動力學(PK)生物分析方法的變更或轉移是常見情況。根據國際人用藥品注冊技術協調會(ICH M10)指南,當出現以下情況時必須進行交叉驗證:"a) 在同一研究中采用不同充分驗證的方法獲得數據;b) 在同一研究中采用相同生物分析方法在不同實驗室獲得數據;c) 在不同研究中采用不同充分驗證方法獲得的數據將被合并或比較,用以支持特殊給藥方案,或關于安全性、有效性和標簽的監管決策"。
ICH M10推薦使用Bland-Altman圖進行方法間的一致性評估。該方法通過將兩種測量結果的差異與其均值進行可視化分析,為評估方法間一致性提供了直觀依據。在此分析框架下,當缺乏公認參考方法時,兩次測量結果的平均值被視為真實值的最佳估計。 基于此前提,該圖的核心價值在于能夠有效識別系統偏差,特別是判斷差異是否隨待測物濃度水平的變化而呈現某種趨勢,即檢測濃度依賴性偏差的存在。
然而,盡管ICH M10推薦使用Bland-Altman圖進行評估,卻并未明確給出用于判定兩種方法是否等效的具體統計標準,這為實際工作中的決策帶來了不確定性。針對上述問題,我們調研了現有文獻與行業實踐,并將在下文中總結基于Bland-Altman圖的交叉驗證一致性標準,以期為業界同仁提供參考。
PART 01
Bland-Altman圖

圖1 Y軸為差值的B-A圖
X軸:表示兩種方法測量結果的平均值 (A+B)/2,作為待測物真實值的最佳估計。
Y軸:表示兩種方法測量結果的差異 (A-B),或百分比差異 (A-B)/Mean × 100%。

圖2 Y軸為百分比差值的B-A圖
在Bland-Altman分析中,縱坐標的設定直接影響對方法間一致性的解讀。通常,縱坐標有兩種表達方式:絕對差值(A-B)與百分比差值[(A-B)/Mean×100%]。這兩種表達方式在圖形解讀上具有本質區別:
當采用絕對差值時,圖形反映的是方法間差異的絕對量級。此時繪制的一致性界限為固定數值范圍(如±2.5 μg/mL),適用于評估差異是否在全濃度范圍內保持恒定。然而,在生物分析常見的寬濃度范圍場景中,這種表達可能產生誤導——低濃度時相同的絕對差異可能代表顯著誤差,而高濃度時則顯得微不足道。
相比之下,百分比差值將差異表示為相對量,其一致性界限為相對范圍(如±30%)。這種表達更符合生物分析方法驗證中基于百分比的標準,能夠消除濃度絕對值對差異解讀的影響。當方法間存在比例性誤差時,百分比差值的分布將呈現隨機分布模式;若此時仍觀察到明顯趨勢,則提示存在需要深入研究的非比例性系統誤差。
在生物分析交叉驗證實踐中,由于待測物濃度常跨越數個數量級,且方法性能標準通常以相對誤差定義,采用百分比差值作為縱坐標更能提供符合專業認知的一致性評估。
PART 02
Bland-Altman圖一致性標準
基因泰克(Genentech)在其發表的交叉驗證研究文章中,明確提出了一套與樣本量相適應的標準框架。該框架包含一個主要標準及一項依樣本量動態調整的次要標準,為交叉驗證中的方法一致性評價提供了清晰且可操作的規范。
主要標準(適用于所有樣本量):
兩種方法的一致性判斷必須滿足:全部樣本濃度百分比差值均值的90%置信區間完全落在±30%范圍內。無論總樣本量多少,此主要標準均為必須達成的先決條件。
次要根據(針對濃度依賴性偏倚):
若斜率的90%置信區間包含0:認為不存在濃度依賴性偏倚;
若斜率的90%置信區間不包含0:需進行亞組分析;
樣本量≥約70:進行四分位分析(Q1、Q2&3、Q4)。若所有亞組的90%置信區間均在±30%內,則認為無濃度依賴性偏倚;
樣本量約40-50:將樣本分為兩個濃度亞組(高低各半)。若兩個亞組的90%置信區間均在±30%內,則認為無濃度依賴性偏倚;
樣本量≤30:不建議進行亞組分析。應依賴主要標準并結合Bland-Altman圖的直觀觀察進行評估。
PART 03
交叉驗證一致性標準的設立依據
交叉驗證中所采用的一致性標準,其設定主要參考了行業通行實踐與統計學的通用原則。具體來看,±30%判定閾值的設置,主要借鑒了實際樣本再分析(ISR)中常用的接受標準。該閾值為兩個在不同實驗室或平臺中均經過完整驗證的方法之間的比較,設定了可接受的偏差范圍。
在置信區間的選擇方面,90%置信水平的設定參考了生物等效性研究中的常見做法。該置信水平在行業中被廣泛用于評價方法間的一致性,采用這一標準有助于使本次方法比較的評估過程與業界常用統計規范保持一致,從而增強結果的可比性。
PART 04
案例
在明確了交叉驗證的科學標準后,讓我們通過一個真實案例來看看這套標準如何落地。基因泰克在推進抗TIGIT抗體tiragolumab的全球臨床研究時,就面臨一個關鍵問題:同一檢測方法在不同實驗室能否產生一致可信的數據?他們用完整的驗證過程給出了答案。
實驗對象與樣本
研究采用了100份來自全球臨床試驗的人血清實際研究樣本為分析對象。樣本選擇采用分層抽樣策略,覆蓋6 μg/mL至252 μg/mL的預期濃度范圍,并按濃度四分位數進行不等量抽樣,其中最低濃度區間(Q1)和最高濃度區間(Q4)各抽取30份樣本,中間濃度區間(Q2與Q3)共抽取40份樣本,以確保在全濃度范圍內均具有充分的代表性。
分析方法
研究采用酶聯免疫吸附分析法對tiragolumab進行定量分析。該方法以TIGIT為靶點,使用生物素標記的TIGIT作為捕獲試劑,地高辛標記的TIGIT作為檢測試劑,通過夾心ELISA原理實現目標物的特異性檢測。
統計方法
統計分析采用基于Bland-Altman分析的交叉驗證策略。主要評價標準為全部樣本百分比差值均值的90%置信區間需完全落在±30%范圍內。輔助分析包括繪制百分比差值與濃度均值的Bland-Altman散點圖,以及計算百分比差值與濃度均值回歸斜率的90%置信區間。若斜率置信區間不包含0,則進一步進行濃度四分位亞組分析。
核心結果
統計分析顯示,100個樣本的百分比差值均值為-3.82%,其90%置信區間為[-5.89%, -1.76%],完全滿足預設的±30%等效性標準。回歸斜率的90%置信區間[-0.00005, 0.00003]包含0,表明不存在濃度依賴性偏倚。Bland-Altman圖顯示雖有2個樣本的百分比差異超出±30%,但未呈現明顯的濃度依賴趨勢。綜上,該ELISA方法在兩個實驗室間具有良好的一致性,可用于同一臨床試驗中不同實驗室數據的合并與分析。

圖3 兩個不同實驗室使用相同生物分析方法的Bland-Altman百分比差異圖
注:百分比差值計算公式:((實驗室B濃度 - 實驗室A濃度)/(實驗室A濃度與實驗室B濃度的平均值))× 100%
表1 兩個不同實驗室使用相同生物分析方法的百分比差異及斜率統計分析

在現有監管框架下,常規生物分析交叉驗證的樣本量通常需達到監管指南建議的30例及以上,這使得基于總體樣本的主要標準(90%置信區間落在±30%內)成為實踐中應用最廣泛的判斷依據。然而,如本研究所呈現,當樣本量充足時(如n=100),通過斜率分析與濃度四分位評估的次要標準能夠有效識別潛在的濃度依賴性偏倚,為方法可比性提供更深層次的科學依據。對這部分內容感興趣的讀者,可進一步參閱原文中案例二的詳細討論。
PART 05
熙寧|精翰免疫分析平臺
基于ICH M10推薦的交叉驗證策略,熙寧生物|精翰生物免疫分析平臺在生物分析方法比對與轉移方面擁有豐富項目經驗,并已建立起完善的技術服務體系。我們依托自身技術優勢,配備專業統計能力,為客戶提供符合監管要求的整合統計分析方法的交叉驗證服務。該體系已在多個實際項目中成功應用,能夠確保交叉驗證研究既滿足監管要求,又具備充分的科學嚴謹性。
參考文獻:
[1] Nijem et al. Cross validation of pharmacokinetic bioanalytical methods: Experimental and statistical design. J Pharm Biomed Anal. 2025;252:116485.
[2] European Medicines Agency, ICH guideline M10 on bioanalytical method validation and study sample analysis, 2022.
[3] J.M. Bland, D.G. Altman. Statistical methods for assessing agreement between two methods of clinical measurement.