傾向分數 (Propensity Score, PS) 近年來廣泛的應用在醫學、藥學、流行病學等領域,這是因為相較於傳統的多變量迴歸校正,PS 可以更有效地控制干擾因子對於主要效應的影響。
說起 PS 大家最先聯想到的應該都是傾向分數配對(Propensity Score Matching) 以及傾向分數加權(Propensity Score Weighting)。然而實際操作上,配對常耗費大量時間卻無法配對所有的樣本數,可能造成最終分析目標族群的偏離;而加權後也容易產生偏差、變異數大等精準度變差的問題。
一種新的加權方式:重疊加權 (Overlap Weighting, OW),能夠有效克服上述難題,一起來看看 OW 如何應用。
對於大部分 SAS 使用者來說,在產製報表時都會遇到格式 (Formats) 的問題。SAS 有許多 formats 可供使用,但是總會遇到沒有適合的 formats,例如行動電話格式 0912-345-678 或新臺幣的格式NTD等情況。
這時候 PROC FORMAT 的 PICTURE statement 就是最好的選擇,它能夠讓我們自訂任何想要的格式(只要發揮想像力和創意)。一起來看看如何使用 !
臨床試驗中,決定樣本數永遠是重要的一環,因為嚴重疾病的受試者不一定能順利招募,較少的樣本數可加速試驗的進行且節省試驗耗費的人力與資源。因此,單臂、單階段(single arm single stage)臨床試驗樣本數的設定,要如何兼顧試驗的檢定能力,又能獲得最小的樣本數呢?
大家是否遇過交叉表的細格子中出現 0 的情況,導致卡方分析出現 warning?最後使用邏輯式迴歸,變項的 95%信賴區間無法收斂,導致結果無法參考? 這是稀少事件(Rare event)造成的問題。PROC LOGISTIC 的 Firth regression 可解決以上問題。一起來看看吧!
面對有序且重複的步驟時 SAS DO loop 能幫助我們省去重覆貼語法的費時工作。但在某些情況下 DO loop 其實不需要跑完所有的重複指令也可以得到正確的結果。一起來看看 LEAVE statement 如何勝任這項任務吧。
ROC curve 切點的資訊不明一直為人所垢病,此時分類圖 (classification plots) 是很好的選擇,他提供了切點變化的資訊,讓我們更直觀且準確地選擇切點或比較模型優劣。
我們常會用 ROC curve 來評量模型預測能力的好壞,但是我們真的了解 ROC curve 嗎? ROC curve 是怎麼產生的? ROC 曲線下的面積 AUC 代表什麼 ? ROC curve 背後隱藏的含義是? ROC curve 的形狀又透露什麼資訊呢? 一起來聊聊吧 !
如何快速得知 SAS data set 的筆數? 除了打開 data set 以目測方式查看,SAS 還另外提供了一些有效率的方式可以快速檢視 data set 的筆數,有大量的 data set 需要知道資料筆數時更加實用,一起來看看。
利用 SAS Macro 快速產生 Macro variable list 以及如何利用這些 Macro variable 來為我們實現 data-driven programs ,省去令人疲憊 (且容易出錯) 的重複編碼,讓 SAS Macro 為我們工作。