統計面試題

Chris Beeley

2010-12-14 14:12:56 UTC

view on stackexchange narkive permalink

不確定該工作是什麼，但我認為“向新手解釋x”可能會很好-

a），因為他們可能需要在工作中執行此操作

b）我認為這是對理解的很好考驗。

（+1）：我無法數出我以為自己已經了解一些東西的次數，但是後來我沒能用簡單的話向別人解釋。示例：p值;）

“如果您不能向六歲的孩子解釋它，那麼您可能自己也不了解它”-艾伯特·愛因斯坦。也許不是那麼極端，但是你明白了... :)

我喜歡“解釋p值”，無論是否包含“向新手”部分。

這就是為什麼交叉驗證很棒。很多“外行”的問題和答案。

無論您是否正在面試，這都是非常好的建議！

onestop

2010-12-14 15:17:59 UTC

view on stackexchange narkive permalink

我在其中工作的標準Q遵循以下原則：

看看您聲稱使用過的統計數據包的多元logistic回歸輸出（最好是我們也使用的一個））。 XXX是本金的自變量。您如何了解一位具有主題知識但沒有經過正式統計培訓的同事來解釋結果？（如有必要，提示您分別解釋點估計值，CI，p值）。

在更多的學術背景下，您可能還會問：“看看本文（您）（共同）*的這一模型輸出。告訴我這意味著什麼。令人難以置信的答案是致命的，因為沒有不熟悉的藉口，但卻令人沮喪。

@conjugateprior不正確。只要有至少一位合著者不在場，那便是不合著者所在的地區。該技術的主要用途是在會議演示中。

Jeromy Anglim

2010-12-14 20:01:47 UTC

view on stackexchange narkive permalink

您可能還想考慮一下面試是否是衡量興趣構成的最佳媒介，如果您想衡量先驗的概率或統計知識，最好還是更多地依靠筆試。提出更多問題，從而提高測量的可靠性。它在管理和評分上都更加標準化。開發該工具後，它可能會使用更少的資源進行管理。

然後，您可以將面試作為一種更集中的工具，著眼於口頭和人際交往技巧等因素。

這是個好的觀點。過去，我發現很難判斷給定的候選人是否會工作，除非您過去曾與他們合作過。

Glen

2011-02-11 21:01:38 UTC

view on stackexchange narkive permalink

我曾問過兩個問題：

1）您適合進行多元回歸，以檢驗另一個部門的工人感興趣的特定變量的影響。該變量返回的意義不大，但您同事說這是不可能的，因為眾所周知它會產生作用。您會說/做什麼？

2）您有1000個變量和100個觀察值。您想找到特定響應的重要變量。你會怎麼做？

您是否也可以發布答案？對於1）我認為，可能有一些因變量導致了問題。對於2）我可能會去進行χ²（卡方）統計檢驗

兩者都有很多合理的響應，這是我的快速思考：1）回歸模型來自樣本，該樣本具有隨機變化，因此該模型只是估計，可能會導致1類或2類錯誤。預測變量之間也可能存在嚴重的共線性。對於2），這是大P與小N的問題。有許多技術可以處理這種情況，例如減小尺寸和套索。

2）對變量進行單變量擬合，並找出對減少變量集最重要的變量

kjetil b halvorsen

2016-12-31 11:11:46 UTC

view on stackexchange narkive permalink

此網站上的許多問題/答案都可以提出一些好的問題的想法。我將列出一些我認為不錯的鏈接。我回答的帖子人數過多，因為我對這些帖子了解得更多，而不是因為它們不一定是最好的！我會為每個鏈接提供簡短的評論，以便您決定是否要關注該鏈接。

SVD背後的直覺是什麼？“您能向我們的一位客戶解釋SVD的工作原理嗎？”

通俗易懂的最大似然估計（MLE）“您能用非技術語言解釋最大似然估計的概念嗎？”

塔利布和黑天鵝“告訴我，黑天鵝是什麼，為什麼如此相關？什麼時候相關？”

樣本為“總體”時的統計推斷“當樣本為整體時，您能說什麼統計推斷？”

擬合優度以及選擇線性回歸或Poisson的模型“我們有一個回歸問題，其中響應是計數變量。在這種情況下，您會選擇普通最小二乘還是Poisson回歸？（或其他一些）？請解釋一下您的選擇，這些模型之間的主要區別是什麼？”

有限方差和無限方差有什麼區別“您能用一種盡可能簡單的語言來解釋一個隨機變量具有無限期望或無限方差是什麼意思嗎？這種區別的實際重要性是什麼？請舉例說明。”

什麼是逐步回歸的現代且易於使用的替代方法？“當存在許多可能的預測變量時，如何構建複雜的回歸模型？描述不同的可能策略，並說明每種策略的問題其中”

如何處理邏輯回歸中的完美分離？“邏輯回歸中的分離問題是什麼，它的成因，症狀是什麼？如果確實存在問題，該怎麼辦？？”

為什麼相關矩陣必須是正半定的，它是或不是正半定是什麼意思？和
非正定協方差矩陣告訴我有關我的數據的什麼信息？“解釋為什麼協方差矩陣必須為正（半）定值，這意味著什麼。該事實如何使用？” >

中位數的多維版本是什麼“您能提出一些方法來將中位數泛化為多元數據嗎？”

用分類變量解釋logit回歸中的交互項和識別交互作用的最佳實踐是什麼？和兩個負面的主要作用卻是正面的交互作用？和包括交互作用但不包括模型中的主要作用和當交互作用不顯著時如何解釋主要作用？“解釋交互作用是什麼意思在回歸模型中。具體來說，如果相互作用顯著而主要影響不顯著，那意味著什麼？普通線性回歸和邏輯回歸之間的相互作用解釋有什麼不同嗎？”

對數據使用平方根轉換的原因可能是什麼？和適當的數據轉換“何時，如何以及為什麼在回歸中轉換響應變量（或ANOVA）模型？有其他選擇嗎？

對於非正態分佈的DV，我可以相信ANOVA結果嗎？“您如何對待具有非正態殘差的ANOVA？

當許多重要事物都是一次性的事情時，為什麼統計有用？

如何有效地建模伯努利隨機變量的總和？

何時使用廣義估計方程與混合效應模型？

當我在logistic回歸設置中使用平方損失時，這裡發生了什麼？“為什麼對logistic回歸使用最大似然法？為什麼不是最小平方？”

Neil McGuigan

2010-12-16 02:10:26 UTC

view on stackexchange narkive permalink

這裡是一個大數據集。您如何處理異常值？缺失值怎麼樣？轉換如何？

它們可以處理現實世界的數據嗎？

尊敬的匿名用戶，請不要使用edit進行評論（Neil不適合您）。

Wolfgang

2010-12-14 18:57:49 UTC

view on stackexchange narkive permalink

有一次我被問到如何解釋中心極限定理與一門社會科學領域的新生有關，這些新生幾乎沒有統計學知識。

中心極限定理的相關性是使人們認為一切都是正常的，而實際上什麼都不是。因此得出許多錯誤的結論。

Neil McGuigan

2010-12-16 02:08:32 UTC

view on stackexchange narkive permalink

在創建統計模型時如何防止過度擬合？

好的答案：交叉驗證

Neil McGuigan

2010-12-16 02:06:07 UTC

view on stackexchange narkive permalink

如何對非數字化內容進行數字化？

示例，“用於對音頻數據進行分類的自動特徵提取”

理性：他們能找出如何統計分析尚未在大表中的東西嗎？

您是否還有其他鏈接？這裡的那個不再有效。

@Iamanon https: // link.springer.com / content / pdf / 10.1007 / s10994-005-5824-7.pdf

robin girard

2010-12-14 13:08:35 UTC

view on stackexchange narkive permalink

我經常問“您如何定義/解釋什麼是預測？”

回答此類非常普遍的問題有助於我了解人們是否與特定的預測案例有關。沒有正確的答案，但在面試中綜合回答並非總是那麼容易：)

conjugateprior

2010-12-16 01:33:16 UTC

view on stackexchange narkive permalink

對於觀測數據上下文：

請考慮將此回歸模型應用於該實質性問題。因果關係中可以解釋的內容是什麼？ [進一步探討]您需要學習什麼才能改變看法？

user3153

2011-02-11 19:31:53 UTC

view on stackexchange narkive permalink

您如何計算班加羅爾的檀香木數量？

這是否意味著[Fermi問題]（http://en.wikipedia.org/wiki/Fermi_problem）？

好問題。我在課堂上（公園的樹木）使用了這個版本。他們有了採樣的想法，但往往會錯過對操作定義的需求：何時開始將其稱為樹？

ilanman

2016-12-31 06:28:28 UTC

view on stackexchange narkive permalink

在標題下，注意與相關性：

通常將客戶/用戶參與度用作預測模型的功能。例如，點擊此按鈕的人比不點擊的人更有可能訂閱。週一購物的人比周二購物的人更有可能再次購物。

如果我們將其推向極致：單擊“購買”的用戶比不單擊購買的用戶更有可能購買產品。

但是顯然，這對於解釋為什麼某些用戶訂閱而有些用戶不訂閱的幫助不是很大。

您將如何使用能夠解釋為什麼訂閱的客戶功能與與訂閱高度相關但完成任務所必需的功能進行平衡？

Neil McGuigan

2010-12-16 02:14:20 UTC

view on stackexchange narkive permalink

這是一個 TinkerToy集。向我展示歐幾里得距離如何在三個維度上起作用。現在向我展示多元回歸的工作原理。

他們可以解釋統計學在物理世界中的工作原理嗎？

但是，使用$ N $觀測值進行多元回歸是否需要設置$ N $維的TinkerToy玩具？

如果要散佈具有100個觀測值的兩個變量，則只需要2個維度，而不是100個:)，依此類推

user3153

2011-02-11 19:40:00 UTC

view on stackexchange narkive permalink

我們正在運營一個客戶服務中心。我們每個月接到一百萬個電話。我們如何將其減少到一萬？

刪除99％的手機！

停止支付電話費。

收取通話費用。（在美國有900個號碼...）

這個問題大約是80–20條規則。這是業務中的普遍經驗法則。例如，“您80％的銷售額來自20％的客戶”。微軟指出，通過修復報告最多的20％錯誤，可以消除80％的錯誤和崩潰。因此，這意味著要建立一個FAQ來確定解決這20％的問題

Jeremy Miles

2016-12-31 10:01:10 UTC

view on stackexchange narkive permalink

我們提出的許多問題與已經描述的問題相似。但是有一些我還沒有讀過的用過的方法：可能會要求您在白板上畫出一個程序，以進行類似的操作：模擬擲骰子或其他概率問題，或計算一系列素數（例如小於1,000,000的質數）-您可以使用所需的任何語言來執行此操作，但是大多數人選擇R，有些人選擇Python（我相信），但是我想您可以選擇Stata，SAS，SPSS ，Matlab等。您可能會被問到一些問題，以探索您對所選編程語言的了解的深度-例如，為什麼在R中使用Apply而不是for循環。

您可能還會被要求設計一個實驗或其他研究來研究某些東西（通常是實用的東西），有時這與我們所做的工作有關，但通常與我們所做的工作無關。（您不應該了解我們所做的工作，但是即使您知道某些領域的知識，您也應該能夠掌握未曾聽說過的問題的要點並明智地進行思考。這是錯誤的-沒關係，您不應該具有領域知識）。可能會要求您考慮諸如電源之類的事情。

Mike Anderson

2010-12-14 19:12:16 UTC

view on stackexchange narkive permalink

在進行定量變量的方差分析時，有時會發現變量的頻率很高（> 5），然後我們使用Fisher精確檢驗來找到變量的獨立性。

這可能包含在克里斯的回答中。

對這一問題的正確答案是否包括知道關於固定邊際是否有意義以及對這個問題有知情的意見存在爭議？

Mark L. Stone

2017-03-18 04:38:54 UTC

view on stackexchange narkive permalink

去年洋基隊的平均帶薪上座率為55,000。您隨機詢問紐約市的一群人上賽季是否參加了洋基隊的比賽，如果參加了，則記錄他們的出勤率。您問參加遊戲的人參加過的遊戲的平均付費出席量是多少？

我將給您提示我的答案（未提供提示）：偏向長度的採樣。我為此打出全壘打，但這還不足以贏得比賽，哈哈。注意：我提到了許多有關如何進行抽樣的警告，面試官告訴我不要理會所有這些警告。