我喜歡G van Belle關於統計經驗法則的書,並在較小程度上喜歡Phillip I Good和統計學中的常見錯誤(以及如何避免它們)。詹姆斯·W·哈丁(James W. Hardin)。當解釋實驗和觀察研究的結果時,它們解決了常見的陷阱,並為統計推斷或探索性數據分析提供了實用建議。但是我感到有些缺乏“現代”指南,尤其是在各個領域對計算和健壯統計數據的使用日漸增長,或者例如在機器學習社區中引入了機器學習技術的情況下。臨床生物統計學或遺傳流行病學。
除了可以在其他地方解決的數據可視化中的計算技巧或常見陷阱之外,我想問一下:您建議提高效率的最佳經驗法則是什麼數據分析?(每個答案一個規則,請)。
我正在考慮您可能會提供給沒有統計學背景的研究人員的同事的指導原則建模或中級到高級課程的學生。這可能與數據分析的各個階段有關,例如採樣策略,特徵選擇或模型構建,模型比較,後估計等。