您的位置 首页 kreess

指南解讀系列|你的PS用得溜嗎?我是指傾向性評分法 ; )

公眾號:醫學大數據挖掘分析隨機對照試驗(randomized controlled trial,RCT),真實世界研究(real world study,RWS)中的混雜因

公眾號:醫學大數據挖掘分析

隨機對照試驗(randomized controlled trial,RCT),真實世界研究(real world study,RWS)中的混雜因素處理是尤為重要的,除瞭傳統的幾種方法外,傾向性評分法更成為瞭近年來的大勢,但是該方法還沒有規范化的報告指南,今天我們就瞭解一下中國臨床腫瘤學會(CSCO)生物統計學專傢委員會RWS方法學小組經充分討論形成的一些共識。

上圖為在PubMed上搜索propensity score的結果,其中,今年(截至2021.07)已有4900+篇相關文章。

傾向性評分法

當我們需要在觀察性研究中對比兩組不同人群的不同特征或者疾病發生發展時,兩組人群往往會存在許多潛在的混雜因素的不均衡,而這些不均衡會使我們的比較結果產生偏倚。傾向性評分法(propensity score,PS)本身不能控制混雜,可以通過匹配,分層,逆概率加權和協變量校正的方法來提高組間均衡性,削弱混雜因素的影響。

四種方法優劣

1. PS匹配結果得當時,接近於隨機化研究,控制混雜因素的優勢較分層和校正更明顯,但是有丟失樣本的局限;

2. PS分層可以利用所有數據,但層之間的個體質量無法控制,可能在PS評分分佈偏離較大時,存在有的層隻有對照組或者試驗組的情況,另外,在生存分析中無法很好地運用;

3. PS協變量校正也可以利用所有數據,需要明確定義回歸模型,但由於沒有明確在研究設計還是分析時進行考慮,校正策略易受分析結果影響;

4. PS逆概率加權既可以利用所有數據,控制混雜因素的優勢又較分層和校正更明顯,其結果最接近於隨機化研究,但如果遇到極端傾向評分值影響,分析結果會不穩定。

PS法的適用范圍

主要用於觀察性比較研究或非隨機對照研究中組間協變量分佈不均衡的情形,也可用於隨機化失敗的探索性臨床研究中。

不適用於以下情況

1.PS法不可用於未知或未測量(unmeasured)混雜因素的控制;

2.PS法不適用於時依性協變量所致混雜因素的控制;

3.PS貪婪匹配法不適用於組間PS評分重疊范圍(overlap)過小時(見下圖),該情況下應用PS貪婪匹配法將導致匹配後損失大量樣本,帶來估計偏差;

4.PS分層、PS協變量校正、PS逆概率加權不適用於組間PS評分分佈相互偏離較大時,此時的校正可能產生錯誤的估計值;

5.當幹預措施隨時間發生變化時,PS方法可能失效;

6.當幹預措施罕見時將影響PS評分估計的效果,PS方法可能失效。

PS的應用規范

選擇協變量

關鍵的協變量包括影響結局的基線變量,在協變量取值可靠的前提下,結合專業知識盡可能排除中介因素、對撞因素和工具變量,識別後門路徑中的混雜因素。選擇協變量應在制定分析計劃時事先確定,確定後不應隨意更改;

PS評分模型選擇

最常用的模型為logistic回歸、probit回歸和判別分析、機器學習等方法,方法的選擇不應受研究推論影響,無論采用何種模型,每一位觀察對象進入處理組的概率不為零。評分模型也應在制定分析計劃時事先確定;

PS方法的選擇及參數設置

可以結合上文的方法優劣對比進行選擇,如在樣本量較大時可以考慮PS匹配法,否則可以考慮PS逆概率加權法。得到PS評分後,需要繪制PS評分分佈圖,考察重疊假定(overlap assumption);

均衡效果評價

目前用於評價組間基線均衡性的方法有指標評價法(如標準化差值)和圖形法(如QQ圖、並排箱式圖、累積分佈函數圖等);

估計處理效應

如為探索性研究,通常不進行因果推斷。當研究的目的是作為支持上市的主要證據時,需在分析中考慮進行因果推斷並估計因果效應。因果效應通常分為總體人群的平均因果效應和處理組平均因果效應。而PS法隻能考慮已測量的混雜因素,在實際研究中,人們可能永遠無法找到所有的潛在混雜因素。所以PS法用於因果推斷需要謹慎對待,需要滿足正則性和條件可交換性;

敏感性分析等其他考慮

敏感性分析策略需要在分析計劃中事先設定,對分析結果的穩定性進行檢驗。另外,缺失值的處理原則也需要註意事先計劃和確定。

在觀察性研究的STROBE指南的基礎上(點擊回顧往期推文),結果報道核查表如下:

註意一些常見問題

1.PS法不能取代隨機對照設計,RCT依然是臨床研究的金標準;

2.PS評分變量選擇可能不充分。納入PS評分模型的變量會直接影響計算結果,應充分考慮所有可能的混雜因素;

3.調整前和調整後的情況未充分說明。應對PS評分方法調整前後的協平衡成程度進行充分說明,明確應用前提和應用效果;

4.PS匹配的相關問題。如:PS匹配需滿足重疊假定,若在匹配前未評估會導致匹配後損失大量樣本,帶來估計偏差,從而影響研究結論;

5.未進行充分的敏感性分析。不同PS法得到的估計結果不同時,研究結論不穩健,需要進一步驗證。

參考文獻:

[1]黃麗紅,趙楊.傾向性評分方法及其規范化應用的統計學共識[J].中國衛生統計,2020,37(12月6):952-958.[doi:10.3969/j.issn.1002-3674.2020.06.041]


更多內容,請關註“醫學大數據挖掘分析”公眾號,歡迎留言聯系~

郵箱:[email protected]

地址:廣州市天河區珠江東路高德置地秋廣場F座

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部