傾向分數 (Propensity Score, PS) 近年來廣泛的應用在醫學、藥學、流行病學等領域,這是因為相較於傳統的多變量迴歸校正,PS 可以更有效地控制干擾因子對於主要效應的影響。
說起 PS 大家最先聯想到的應該都是傾向分數配對(Propensity Score Matching) 以及傾向分數加權(Propensity Score Weighting)。然而實際操作上,配對常耗費大量時間卻無法配對所有的樣本數,可能造成最終分析目標族群的偏離;而加權後也容易產生偏差、變異數大等精準度變差的問題。
一種新的加權方式:重疊加權 (Overlap Weighting, OW),能夠有效克服上述難題,一起來看看 OW 如何應用。
臨床試驗中,決定樣本數永遠是重要的一環,因為嚴重疾病的受試者不一定能順利招募,較少的樣本數可加速試驗的進行且節省試驗耗費的人力與資源。因此,單臂、單階段(single arm single stage)臨床試驗樣本數的設定,要如何兼顧試驗的檢定能力,又能獲得最小的樣本數呢?
大家是否遇過交叉表的細格子中出現 0 的情況,導致卡方分析出現 warning?最後使用邏輯式迴歸,變項的 95%信賴區間無法收斂,導致結果無法參考? 這是稀少事件(Rare event)造成的問題。PROC LOGISTIC 的 Firth regression 可解決以上問題。一起來看看吧!
ROC curve 切點的資訊不明一直為人所垢病,此時分類圖 (classification plots) 是很好的選擇,他提供了切點變化的資訊,讓我們更直觀且準確地選擇切點或比較模型優劣。
我們常會用 ROC curve 來評量模型預測能力的好壞,但是我們真的了解 ROC curve 嗎? ROC curve 是怎麼產生的? ROC 曲線下的面積 AUC 代表什麼 ? ROC curve 背後隱藏的含義是? ROC curve 的形狀又透露什麼資訊呢? 一起來聊聊吧 !