201309191517常用的無母數統計方法

無母數統計(nonparametric statistics)為「不需要假設分佈的統計方法」,換言之,就是【與母體分配無關】的統計方法。檢定時,因無母數統計缺乏機率表的資訊,通常是採等級(Rank)為主要統計量。適用於母群體分布情況未明、小樣本、母群體分布不為常態也不易轉換為常態的情況。

大家熟知常用的統計方法,如:獨立樣本T檢定(比較兩組觀察值的平均數)。其假設包括「依變項符合常態分佈」、「變異數同質性」、「兩組的樣本為獨立的」。
【註】有時透過數據「轉換」,可以符合必須的假設。常使用的轉換方式可有取log、開根號或其他方式(只要你找得到)。而,轉換也是有他的限制和缺點的,如:
一:轉換後,也不見得就會符合常態分佈
二:轉換後,觀察值的「單位」不在是原有的性質(如:血壓值取log後)。當以統計結果作解釋時,必須特別留意:數值可能已經不具單位原有的意義,甚至扭曲。
此時,其實另外的處理方式,就是:以無母數統計的Mann-Whitney U-test 來取代獨立T。
無母數統計一律是使用「排序」作計算,也就是說Mann-Whitney U是在檢定兩組人的「平均排序」是否有顯著差異,既然已經把原始分數轉成排序了,那當然就不會有「常態性」跟「變異數同質性」的假設了。
再如:相依樣本T檢定、單因子變異數分析、單因子重複量數變異數分析,也都是要有一些假設的。如:單因子變異數分析來說,它也是有「常態性」跟「變異數同質性」的假設。

【小結】無母數的使用時機:

  • 當觀察值不符合常態分佈,且無適當的轉換方法,或轉換後仍不符合常態
  • 樣本數太小,少於30人(或每組人數少於10人)
  • T檢定與ANOVA,違反變異數同質性檢定

出處

常用的無母數統計方法

1、 卡方檢定
卡方檢定主要是用於處理類別資料的分析。在有母數統計方法中,以卡方分配(設X1~ X n是抽自常態母體的隨機樣本,且母體變異數為σ 2,則為自由度為n-1的卡方分配)作為檢定統計量來探討單一母體變異數的估計與檢定。因為有母數統計方法必須有嚴格的假設前提,而卡方檢定在檢定時只需對母體做一些假設(較不用知道母體參數及母體分配)。因此,有些統計書籍將卡方檢定歸類為無母數統計方法的範圍。

最常見的卡方檢定有四種:

(1)、適合度檢定(Test of goodness of fit)
是指接受或拒絕觀察次數與相對應的期望次數是否符合的統計檢定。

(2)、百分比同質性檢定(Test of homogeneity of proportions)
主要是檢定交叉列聯表中的I個群體分配到j個類別,各類別母體百分比例是否有一樣,即是否為同質,故稱之。

(3)、獨立性檢定(Test of independence)
在觀察的樣本中,檢定兩個自變數是否互為相關的檢定;若不是互為獨立的事件,則必須進行關聯性檢定(Test of association),以便瞭解兩者的關聯程度。

(4)、改變顯著性檢定(Test of significance of change)
主要是用來檢定一群受試者對事件前後反應的差異情形。


2、 中位數檢定(The Median Test)
主要是用來檢定多個母體的中位數是否相同,中位數檢定在無母數統計的地位相當於母數統計法中檢定獨立樣本平均數的t檢定。

3、 符號檢定(The Sign Test)
主要是用來檢定兩個相依樣本的差異性,其方法是將觀測值分為三類:若X<Y則歸入(+)類,若X>Y則歸入(-)類,若X=Y則歸入同分(tie)類,以進行檢定。

4、 Wilcoxon符號等級檢定
主要的用法和符號檢定相同,兩者不同的地方是符號檢定並未考慮差值的大小,而Wilcoxon符號等級檢定則可以反映這些差值的正負方向與大小,將每對差值的絕對值依大小次序加以排列,即可進行檢定。

5、 Wilcoxon等級和檢定(The Wilcoxon Rank Sum Test)
最先由Wlcoxon於1945年提出。主要是用來檢定兩個母體位置參數相等的假設,但由於Wilcoxon只考慮樣本數相等的情形,所以在1947年,Mann和Whitney考慮樣本數不同的情形,而提出曼惠二氏U檢定。

6、 曼惠二氏U檢定法(Mann-Whitney Test)
主要是檢定兩個獨立樣本是否來自相同的母體的無母數統計方法。註:Wilcoxon的方法比較容易看出檢定量的基本原理,而Mann-Whitney的方法在使用上比較容易,不過兩種方法最後的檢定結果都會是一樣的。


7、 克-瓦二氏單因子等級變異數分析(Kruskal-Wallis Test)
1952年Kruskal-Wallis將Mann-Whitney的兩獨立樣本檢定推廣到k個獨立樣本,k個隨機獨立樣本分別由k個可能不相同的母體抽出,以檢定k個獨立樣本是否來自同一個母體或平均數相等的k個母體。

8、 弗理曼二因子等級變異數分析(The Friedman Test)
主要是適用於重複樣本次序變數資料的無母數統計方法。將個體重複接受k個實驗條件後的資料分成等級,便可利用弗理曼二因子等級變異數分析進行分析。

9、 麥內班檢定(The McNemar Test)
主要是適用於兩個關聯樣本的資料,其中將X與Y相關的名目變項以(0)與(1)兩種類型來表示,在檢定的過程中,整理成為2×2 的列聯表,以進行檢定分析。

10、 寇克蘭Q檢定(The Cochran Q Test)
將McNemar Test擴展使用,即為寇克蘭Q檢定。假設有k種處理,每種處理分別獨立使用很多次,其結果可整理為2×k的列聯表,並以卡方檢定比較這k種處理的差異性。

11、 柯-史單一樣本檢定(The Kolmogorov-Smirnov Test)
主要是將單一樣本的次序變項作適合度檢定,即決定樣本的分配是否與該理論的次數分配有差異性。

12、 柯-史兩樣本檢定(The Kolmogorov-Smirnov Test)
是將柯-史單一樣本檢定擴展使用,主要是檢定兩個獨立樣本的累積觀察次數的分配是否一致。若是,則樣本可能來自同一個母體;反之,則否。

13、 費雪爾正確概率檢定
若2×2的列聯表是由兩個不同小樣本受試者的間斷變數資料所組成,則可以使用費雪爾正確概率檢定。

14、 斯皮爾曼等級相關檢定(The Spearman’s Rank Test)
主要是用來衡量兩組經過等級轉換後的變數資料間的相關程度。

【出處】http://tw.myblog.yahoo.com/da_sanlin/article?mid=408&sc=1

回應
即時新台幣匯率
COMMODITIES