我正在尋找從最基本的到更高級的一些統計(我想是概率)面試問題。答案不是必需的(儘管可以鏈接到本網站上特定問題的鏈接)。
我正在尋找從最基本的到更高級的一些統計(我想是概率)面試問題。答案不是必需的(儘管可以鏈接到本網站上特定問題的鏈接)。
不確定該工作是什麼,但我認為“向新手解釋x”可能會很好-
a),因為他們可能需要在工作中執行此操作
b)我認為這是對理解的很好考驗。
我在其中工作的標準Q遵循以下原則:
看看您聲稱使用過的統計數據包的多元logistic回歸輸出(最好是我們也使用的一個) )。 XXX是本金的自變量。您如何了解一位具有主題知識但沒有經過正式統計培訓的同事來解釋結果? (如有必要,提示您分別解釋點估計值,CI,p值)。
您可能還想考慮一下面試是否是衡量興趣構成的最佳媒介,如果您想衡量先驗的概率或統計知識,最好還是更多地依靠筆試。提出更多問題,從而提高測量的可靠性。它在管理和評分上都更加標準化。開發該工具後,它可能會使用更少的資源進行管理。
然後,您可以將面試作為一種更集中的工具,著眼於口頭和人際交往技巧等因素。
我曾問過兩個問題:
1)您適合進行多元回歸,以檢驗另一個部門的工人感興趣的特定變量的影響。該變量返回的意義不大,但您同事說這是不可能的,因為眾所周知它會產生作用。您會說/做什麼?
2)您有1000個變量和100個觀察值。您想找到特定響應的重要變量。你會怎麼做?
此網站上的許多問題/答案都可以提出一些好的問題的想法。我將列出一些我認為不錯的鏈接。我回答的帖子人數過多,因為我對這些帖子了解得更多,而不是因為它們不一定是最好的!我會為每個鏈接提供簡短的評論,以便您決定是否要關注該鏈接。
SVD背後的直覺是什麼?“您能向我們的一位客戶解釋SVD的工作原理嗎?”
通俗易懂的最大似然估計(MLE)“您能用非技術語言解釋最大似然估計的概念嗎?”
塔利布和黑天鵝“告訴我,黑天鵝是什麼,為什麼如此相關?什麼時候相關?”
樣本為“總體”時的統計推斷“當樣本為整體時,您能說什麼統計推斷?”
擬合優度以及選擇線性回歸或Poisson的模型“我們有一個回歸問題,其中響應是計數變量。在這種情況下,您會選擇普通最小二乘還是Poisson回歸? (或其他一些)?請解釋一下您的選擇,這些模型之間的主要區別是什麼?”
有限方差和無限方差有什麼區別“您能用一種盡可能簡單的語言來解釋一個隨機變量具有無限期望或無限方差是什麼意思嗎?這種區別的實際重要性是什麼?請舉例說明。”
什麼是逐步回歸的現代且易於使用的替代方法?“當存在許多可能的預測變量時,如何構建複雜的回歸模型?描述不同的可能策略,並說明每種策略的問題其中”
如何處理邏輯回歸中的完美分離?“邏輯回歸中的分離問題是什麼,它的成因,症狀是什麼?如果確實存在問題,該怎麼辦? ?”
為什麼相關矩陣必須是正半定的,它是或不是正半定是什麼意思?和
非正定協方差矩陣告訴我有關我的數據的什麼信息?“解釋為什麼協方差矩陣必須為正(半)定值,這意味著什麼。該事實如何使用?” >
中位數的多維版本是什麼“您能提出一些方法來將中位數泛化為多元數據嗎?”
用分類變量解釋logit回歸中的交互項和識別交互作用的最佳實踐是什麼?和兩個負面的主要作用卻是正面的交互作用?和包括交互作用但不包括模型中的主要作用和當交互作用不顯著時如何解釋主要作用?“解釋交互作用是什麼意思在回歸模型中。具體來說,如果相互作用顯著而主要影響不顯著,那意味著什麼?普通線性回歸和邏輯回歸之間的相互作用解釋有什麼不同嗎?”
對數據使用平方根轉換的原因可能是什麼?和適當的數據轉換“何時,如何以及為什麼在回歸中轉換響應變量(或ANOVA)模型?有其他選擇嗎?
對於非正態分佈的DV,我可以相信ANOVA結果嗎?“您如何對待具有非正態殘差的ANOVA?
當我在logistic回歸設置中使用平方損失時,這裡發生了什麼?“為什麼對logistic回歸使用最大似然法?為什麼不是最小平方?”
有一次我被問到如何解釋中心極限定理與一門社會科學領域的新生有關,這些新生幾乎沒有統計學知識。
如何對非數字化內容進行數字化?
理性:他們能找出如何統計分析尚未在大表中的東西嗎?
我經常問“您如何定義/解釋什麼是預測?”
回答此類非常普遍的問題有助於我了解人們是否與特定的預測案例有關。沒有正確的答案,但在面試中綜合回答並非總是那麼容易:)
對於觀測數據上下文:
請考慮將此回歸模型應用於該實質性問題。因果關係中可以解釋的內容是什麼? [進一步探討]您需要學習什麼才能改變看法?
您如何計算班加羅爾的檀香木數量?
在標題下,注意與相關性:
通常將客戶/用戶參與度用作預測模型的功能。例如,點擊此按鈕的人比不點擊的人更有可能訂閱。週一購物的人比周二購物的人更有可能再次購物。
如果我們將其推向極致:單擊“購買”的用戶比不單擊購買的用戶更有可能購買產品。
但是顯然,這對於解釋為什麼某些用戶訂閱而有些用戶不訂閱的幫助不是很大。
您將如何使用能夠解釋為什麼訂閱的客戶功能與與訂閱高度相關但完成任務所必需的功能進行平衡?
這是一個 TinkerToy集。向我展示歐幾里得距離如何在三個維度上起作用。現在向我展示多元回歸的工作原理。
他們可以解釋統計學在物理世界中的工作原理嗎?
我們正在運營一個客戶服務中心。我們每個月接到一百萬個電話。我們如何將其減少到一萬?
我們提出的許多問題與已經描述的問題相似。但是有一些我還沒有讀過的用過的方法:可能會要求您在白板上畫出一個程序,以進行類似的操作:模擬擲骰子或其他概率問題,或計算一系列素數(例如小於1,000,000的質數)-您可以使用所需的任何語言來執行此操作,但是大多數人選擇R,有些人選擇Python(我相信),但是我想您可以選擇Stata,SAS,SPSS ,Matlab等。您可能會被問到一些問題,以探索您對所選編程語言的了解的深度-例如,為什麼在R中使用Apply而不是for循環。
您可能還會被要求設計一個實驗或其他研究來研究某些東西(通常是實用的東西),有時這與我們所做的工作有關,但通常與我們所做的工作無關。 (您不應該了解我們所做的工作,但是即使您知道某些領域的知識,您也應該能夠掌握未曾聽說過的問題的要點並明智地進行思考。這是錯誤的-沒關係,您不應該具有領域知識)。可能會要求您考慮諸如電源之類的事情。
在進行定量變量的方差分析時,有時會發現變量的頻率很高(> 5),然後我們使用Fisher精確檢驗來找到變量的獨立性。
去年洋基隊的平均帶薪上座率為55,000。您隨機詢問紐約市的一群人上賽季是否參加了洋基隊的比賽,如果參加了,則記錄他們的出勤率。您問參加遊戲的人參加過的遊戲的平均付費出席量是多少?
我將給您提示我的答案(未提供提示):偏向長度的採樣。我為此打出全壘打,但這還不足以贏得比賽,哈哈。注意:我提到了許多有關如何進行抽樣的警告,面試官告訴我不要理會所有這些警告。