実験データが出たら、統計処理をしますよね?
統計処理をするときに出てくる、「パラメトリック」と「ノンパラメトリック」って何が違うのかわからないことがあるのでは無いでしょうか。
この記事では、パラメトリック検定とノンパラメトリック検定の違いについて簡単にまとめていきます。
「パラメトリック」「ノンパラメトリック」とは?
パラメトリックは英語で書くと”parametric”、ノンパラメトリックは"nonparametric"。
"parametric"は「parameter(母数)に関する」と言う意味です。
つまり、パラメトリックとノンパラメトリックというのは、parameter(母数)によるかよらないかという違いがあるのです。
母数(ぼすう)というのは、母平均、母分散など母集団を規定する量のこと。
(母集団というのは、調査対象とする集団全体のこと)
検定する対象が何らかのパラメータで規定できるかどうかがパラメトリックとノンパラメトリックの違いになってきます。
パラメトリック検定とは、「母集団」がある特定の分布(正規分布であることが多い)に従うことがわかっているときに使う検定方法。
ノンパラメトリック検定は、標本データの大小順位を利用して行う検定方法。
母集団・平均・分散については、こちらの記事をご覧ください。
パラメトリック検定の種類と特徴
パラメトリック検定の種類
パラメトリック検定では、母集団が特定の分布に従うとわかっている場合に、得られたデータ(標本)から平均や分散など母集団のパラメーターを推定して検定統計量を計算します。
帰無仮説のもとで、計算して出てきた検定統計量を得られる確率を見て仮説を採用するか棄却するかを判断していきます。
パラメトリック検定としてよく使われるのは、
- t検定(1群、2群検定)
- Dunnett検定(多重検定)
- Tukey-Kramer検定(多重比較検定)
- 一元配置分散分析(2つの変数の検定)
などがあります。
t検定についてはこちらの記事にまとめています。
Dunnett検定・Tukey-Kramer検定についてはこちらをご覧ください。
パラメトリック検定の特徴
パラメトリック検定の計算で使う値は、標本の平均値と標準偏差です。
母集団の正規性を前提としているので、あらかじめ母集団が正規性分布に従うかどうかを確認する必要があります。
特徴としては、
- ある程度のサンプルサイズがないとダメ
- 外れ値の影響を受けやすく、外れ値があると有意差が出にくくなる
- 検定の精度は比較的高い
ということが挙げられます。
ノンパラメトリック検定の種類と特徴
ノンパラメトリック検定の種類
ノンパラメトリック検定は母集団の分布を検定の仮定に置かないで行う検定です。
ノンパラメトリックな検定としてよく使われるのは、
- マン・ホイットニーのU検定(2群検定)
- Wilcoxon順位和検定(2群検定)
- Wilcoxonの符号順位検定(対応のある2群の検定)
- Steel-Dwass検定(多重検定)
- カイ二乗検定(正確確率検定)
などがあります。
カイ二乗検定についてはこちらの記事にまとめています。
ノンパラメトリック検定の特徴
ノンパラメトリック検定の特徴としては、
- 母集団の分布を仮定しないので、割と使い勝手が良い
- サンプルサイズが小さい時に検出力の高い検定ができる
- 検定の精度は落ちてしまう
ということが挙げられます。
検出力については、こちらの記事にまとめています。
【生命科学系のための統計】パラメトリックとノンパラメトリックの違い まとめ
パラメトリック検定とノンパラメトリック検定の違いについて、まとめます。
- パラメトリック検定とノンパラメトリック検定の大きな違いは母集団を特定の分布に仮定するかどうか
- パラメトリック検定は、データから平均、分散などを計算して検定統計量を算出する
- ノンパラメトリック検定は、データの大小関係を使って検定統計量を算出する
- サンプルサイズが小さい場合はノンパラメトリック、大きい場合はパラメトリック検定を使うことが多い