題:
什麼是用於序數數據的良好基本統計數據?
PaulHurleyuk
2010-07-20 01:23:23 UTC
view on stackexchange narkive permalink

我從調查問題中獲得了一些常規數據。就我而言,它們是 Likert風格的響應(強烈不同意-不同意-中立-同意-強烈同意)。在我的數據中,它們的編碼為1-5。

常見選擇包括-每組中位數,眾數,比例或累積比例
八 答案:
Jeromy Anglim
2011-03-31 09:27:05 UTC
view on stackexchange narkive permalink

我將從應用的角度來論證,平均數通常是總結李克特項目集中趨勢的最佳選擇,具體來說,我正在考慮諸如學生滿意度調查,市場調查量表,員工等背景意見調查,人格測驗項目以及許多社會科學調查項目。

在這種情況下,研究的消費者通常希望回答以下問題:

  • 哪些陳述相對於其他陳述或多或少地達成共識?
  • 哪個團體或多或少都同意給定的陳述?
  • 隨著時間的流逝,同意上升還是下降?

出於這些目的,均值具有以下好處:

1。均值很容易計算:

  • 很容易看到原始數據和均值之間的關係。
  • 在實用上很容易計算。因此,均值可以輕鬆地嵌入到報告系統中。
  • 它還可以促進跨上下文和設置的可比性。

2。均值相對容易理解和直觀:

  • 該均值通常用於報告李克特項目的集中趨勢。因此,研究的消費者更有可能理解均值(從而信任均值並對其採取行動)。
  • 一些研究人員更喜歡採用可以說更為直觀的方法來報告樣本回答的百分比。 4或5。即,它具有“百分比協議”的相對直觀的解釋。從本質上講,這只是均值的另一種形式,具有 0,0,0,1,1,編碼。
  • 而且,隨著時間的流逝,研究的消費者逐漸建立起框架參考。例如,當您逐年或跨學科比較教學表現時,您會逐漸意識到平均3.7、3.9或4.1表示什麼。

3。平均值是一個數字:

  • 當您要提出諸如“學生對X主題比Y主題更滿意”這樣的說法時,單個數字特別有價值。
  • 根據經驗,我還發現單個數字實際上是李克特項目中感興趣的主要信息。標準差往往與均值接近中心得分的程度有關(例如3.0) 。當然,根據經驗,這可能不適用於您的情況。例如,我在某處讀到,當You Tube分級擁有星級系統時,無論是最低分級還是最高分級都有很多。因此,檢查類別頻率很重要。

4。

  • 雖然沒有正式測試過,但並沒有太大的區別,我假設為了比較項目,參與者組或一段時間內的任何項目的中心趨勢評分,合理選擇用於生成平均值的縮放比例會得出類似的結論。
好貼!您是否對不同文化/國家如何使用李克特量表有什麼想法,這將對這些結果產生重大影響?
@chase對此進行了研究,但是距離我研究已經有一段時間了。這是在Google學者上進行搜索的示例,網址為http://scholar.google.com.au/scholar?q=cross+cultural+use+res+sepons+scales&hl=zh-CN&as_sdt=0&as_vis=1&oi=scholart
我同意傑里米·安格利姆(Jeromy Anglim)先生關於使用均值(即準確的加權均值)作為有序分類變量的最可靠的“無偏**”描述的合理解釋,例如使用Likert量表,其中每個數據的使用積分有助於最終平均值。
我問了一個問題[關於在cogsci.stackexchange.com上使用反應量表的文化差異](http://cogsci.stackexchange.com/q/1033/52)
Neil McGuigan
2010-07-20 01:34:47 UTC
view on stackexchange narkive permalink

頻率表是一個很好的起點。您可以計算每個級別的計數和相對頻率。同樣,總數和缺失值的數量也可能有用。

您還可以使用列聯表一次性比較兩個變量。也可以使用鑲嵌圖進行顯示。

chl
2010-10-09 20:03:52 UTC
view on stackexchange narkive permalink

對於基本摘要,我同意報告頻率表和有關集中趨勢的某些指示是可以的。作為推斷,最近發表在PARE上的一篇文章討論了t檢驗與MWW檢驗,五點李克特項目:t檢驗與Mann-Whitney-Wilcoxon

處理,我建議閱讀Agresti對有序分類變量的評論:

Liu,Y和Agresti,A(2005)。 有序分類數據的分析:概述和最新發展研究與測試協會,14(1),1-73。

它在很大程度上超越了常規統計數據,例如基於閾值的模型(例如比例賠率比率),值得代替Agresti的 CDA書。

下面,我展示了三種處理Likert項目的方法;從頂部到底部,分別是“頻率”(標稱)視圖,“數字”視圖和“概率”視圖(部分信用模型):

alt text

數據來自 ltm 包中的 Science 數據,其中與 technology 相關的項目(“不依賴於基礎科學研究”,在四點量表上的回答“強烈不同意”至“強烈同意”

doug
2010-08-10 11:42:11 UTC
view on stackexchange narkive permalink

常規做法是使用非參數統計量 排名總和 平均排名 來描述序數數據。

這是它們的工作方式:

等級總和

  • 為每個組中的每個成員分配等級;

  • 例如,假設您正在為兩個相對的足球隊的每個球員尋找目標,然後將兩隊中的每個成員從頭到尾排名;

  • 通過添加每個組的排名 來計算排名總和;

  • 排名總和的大小可以告訴您每個組的等級之間的接近程度

平均等級

M / R為統計數據比R / S更複雜,因為它可以補償您比較的組中大小不相等的數據。因此,除了上述步驟之外,您還需要將每個總和除以組中成員的數量。

一旦有了這兩個統計信息,您就可以例如對等級總和進行z檢驗以查看如果兩組之間的差異具有統計學意義(我認為這是 Wilcoxon秩和檢驗,它可以互換,即在功能上等同於Mann-Whitney U檢驗)。

這些統計信息的R函數(無論如何我都知道):

wilcox.test (在標準R安裝中)

均值包中的

Peter Flom
2012-09-02 21:28:00 UTC
view on stackexchange narkive permalink

基於摘要本文可能有助於比較幾個Likert量表變量。它比較了兩種類型的非參數多重比較測試:一種基於排名,另一種基於Chacko的測試。它包括模擬。

目前,@PeterFlom似乎幾乎是在評論。儘管ACM數字圖書館可能不太容易受到鏈接腐爛的影響,但您是否願意對文章發表一些看法,也許是它提供有用信息的前提?
嗨,@gung,我不確定在此長線程中將註釋放在何處。自從今天發布的問題關閉以來,我在這裡添加了引文,這篇文章似乎很有用(並涵蓋了我在其他地方未見的問題)
Galois Theory
2011-08-12 18:47:21 UTC
view on stackexchange narkive permalink

我通常喜歡使用馬賽克圖。您可以通過合併其他感興趣的協變量(例如:性別,分層因素等)來創建它們。

VARNOLD
2012-04-13 05:41:25 UTC
view on stackexchange narkive permalink

我同意Jeromy Anglim的評價。請記住,李克特反應是估計值–您沒有使用完全可靠的標尺來測量尺寸穩定的物理對象。在使用合理的樣本量時,平均值是有力的度量。

在商業和產品R&D中,平均值是迄今為止最常用的Likert量表。在使用李克特量表時,我通常會選擇一種最適合研究問題的量度。例如,如果您談論的是“偏好”或“態度”,則可以使用多個基於李克特的指標,每個指標提供的見解都略有不同。

要評估以下問題:“細分受眾群在$ i $對提供$ X $的服務做出反應,”,我可能會看一下(1)算術平均值,(2)確切的中位數,(3)最有利的響應百分比(頂部的方框),(4)頂部兩個方框的百分比,(5)頂部的兩個框與底部的兩個框的比率,(6)中檔框的百分比...等等。每種度量都講述了一個不同的故事。在一個非常關鍵的項目中,我使用了多個基於李克特的指標。當特定的交叉表具有“有趣的”結構或看起來信息豐富時,我還將使用帶有少量樣本的多個指標。啊...統計的藝術。

Jonathan
2011-09-09 06:16:18 UTC
view on stackexchange narkive permalink

“盒子分數”通常用於總結序數數據,特別是在帶有有意義的語言錨的情況下。換句話說,您可能會報告“前2個框”,即選擇“同意”或“強烈同意”的百分比。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 2.0許可。
Loading...