我將從應用的角度來論證,平均數通常是總結李克特項目集中趨勢的最佳選擇,具體來說,我正在考慮諸如學生滿意度調查,市場調查量表,員工等背景意見調查,人格測驗項目以及許多社會科學調查項目。
在這種情況下,研究的消費者通常希望回答以下問題:
出於這些目的,均值具有以下好處:
0,0,0,1,1,
編碼。頻率表是一個很好的起點。您可以計算每個級別的計數和相對頻率。同樣,總數和缺失值的數量也可能有用。
您還可以使用列聯表一次性比較兩個變量。也可以使用鑲嵌圖進行顯示。
對於基本摘要,我同意報告頻率表和有關集中趨勢的某些指示是可以的。作為推斷,最近發表在PARE上的一篇文章討論了t檢驗與MWW檢驗,五點李克特項目:t檢驗與Mann-Whitney-Wilcoxon。
處理,我建議閱讀Agresti對有序分類變量的評論:
Liu,Y和Agresti,A(2005)。 有序分類數據的分析:概述和最新發展。 研究與測試協會,14(1),1-73。
它在很大程度上超越了常規統計數據,例如基於閾值的模型(例如比例賠率比率),值得代替Agresti的 CDA書。
下面,我展示了三種處理Likert項目的方法;從頂部到底部,分別是“頻率”(標稱)視圖,“數字”視圖和“概率”視圖(部分信用模型):
數據來自 ltm
包中的 Science
數據,其中與 technology 相關的項目(“不依賴於基礎科學研究”,在四點量表上的回答“強烈不同意”至“強烈同意”
常規做法是使用非參數統計量 排名總和 和 平均排名 來描述序數數據。
這是它們的工作方式:
等級總和
為每個組中的每個成員分配等級;
例如,假設您正在為兩個相對的足球隊的每個球員尋找目標,然後將兩隊中的每個成員從頭到尾排名;
通過添加每個組的排名 來計算排名總和;
排名總和的大小可以告訴您每個組的等級之間的接近程度
平均等級
M / R為統計數據比R / S更複雜,因為它可以補償您比較的組中大小不相等的數據。因此,除了上述步驟之外,您還需要將每個總和除以組中成員的數量。
一旦有了這兩個統計信息,您就可以例如對等級總和進行z檢驗以查看如果兩組之間的差異具有統計學意義(我認為這是 Wilcoxon秩和檢驗,它可以互換,即在功能上等同於Mann-Whitney U檢驗)。
這些統計信息的R函數(無論如何我都知道):
wilcox.test (在標準R安裝中)
均值包中的
基於摘要本文可能有助於比較幾個Likert量表變量。它比較了兩種類型的非參數多重比較測試:一種基於排名,另一種基於Chacko的測試。它包括模擬。
我通常喜歡使用馬賽克圖。您可以通過合併其他感興趣的協變量(例如:性別,分層因素等)來創建它們。
我同意Jeromy Anglim的評價。請記住,李克特反應是估計值–您沒有使用完全可靠的標尺來測量尺寸穩定的物理對象。在使用合理的樣本量時,平均值是有力的度量。
在商業和產品R&D中,平均值是迄今為止最常用的Likert量表。在使用李克特量表時,我通常會選擇一種最適合研究問題的量度。例如,如果您談論的是“偏好”或“態度”,則可以使用多個基於李克特的指標,每個指標提供的見解都略有不同。
要評估以下問題:“細分受眾群在$ i $對提供$ X $的服務做出反應,”,我可能會看一下(1)算術平均值,(2)確切的中位數,(3)最有利的響應百分比(頂部的方框),(4)頂部兩個方框的百分比,(5)頂部的兩個框與底部的兩個框的比率,(6)中檔框的百分比...等等。每種度量都講述了一個不同的故事。在一個非常關鍵的項目中,我使用了多個基於李克特的指標。當特定的交叉表具有“有趣的”結構或看起來信息豐富時,我還將使用帶有少量樣本的多個指標。啊...統計的藝術。
“盒子分數”通常用於總結序數數據,特別是在帶有有意義的語言錨的情況下。換句話說,您可能會報告“前2個框”,即選擇“同意”或“強烈同意”的百分比。