心理統計第1回
統計法とは
仕事の目的に応じて、対象を特定し、その対象の関心のある性質について
適切なデータを収集、調査して、これから必要な情報を導きだすための方法
データは、その種類、内容、調査の方法などによって、導きだせる情報が違う
統計(大辞林第二版の説明)
集団現象を数量的に把握すること。一定集団について、調査すべき事項を定め、その集団の性質、傾向を数量的に表すこと。
統計が扱う問題は、複数の個体で構成され、「明確に定義された」具体的な集団に関すること。
個体を集団として扱い、全体の性質を把握する。
仕事の目的に対応して、対象とする集団の個体の関心のある性質を
数量的に把握し、目的の達成に必要な情報を導きだす。
データから情報を導きだす方法
数える、分ける、ソート、並べる、比べる
DIKW
データdata symbol,message
情報information who,what,where,when
知識knowledge how
知恵wisdom why
gigo
ゴミデータからはゴミ情報しか出てこない
garbage in garbage out
心理学などの調査では、順序尺度データに等間隔を想定し、間隔尺度のデータとみなすことも。
心理統計第2回
スタージェスの公式
度数分布の区切り
n=20 m=5-6
n=40 m=6-7
n=80 m=7-8
n=160 m=8-9
n=320 m=9-10
心理統計第3回
通常の平均
相加平均、重心、算術平均とも
ただし外れ値の影響を受けやすい(全部足すから)
そこで
刈り込み平均 trimmed mean
スケートやスキーの採点と同じ
スコアが安定してるところだけとりだす
中央平均 midmean
中央の50%だけで平均を取る
ウインソー化平均 wintered mean
一番したの値、上の値と同じとみなして計算
データの個数は削除しない
幾何平均、調和平均、加重平均
中央値
平均ほどぶれない、外れ値の影響を受けにくい
最頻値
どこで区分するか(class化)で見え方も変わってくる
五数要約
five number summary
第0四分位数 最小値
第1四分位数 25%値
第2四分位数 中央値
第3四分位数 75%値
第4四分位数 最大値
↓
箱ひげ図 box plot
歪度 わいど skewness
データの分布の非対称性
(対称からのズレ)
左にずれる(下に偏り) 歪度>0
右にずれる(上に偏り) 歪度<0
歪度=0 左右対称
尖度 せんど kurtosis
データの分布の尖り具合
中心的な位置に集中している程度
集中度低い 尖度<0
集中度高い 尖度>0
尖度=0 正規分布と同じ集中度
URT関数を使用すると、尖度を求めることができます。尖度は、複数以上のデータがある場合、データの分布の尖り具合を調べる時に使用します。
尖度は0を中心として、0より大きい値の場合には、平均値に近い値が多く含まれていることを表します。尖度が0より小さい値の場合には、平均値に近い値が少ないことを表します。
SKEW関数を使用すると、歪度を求めることができます。歪度は、複数以上のデータがある場合、データの分布の歪み具合を調べる時に使用します。
歪度は0を中心として、0より大きい値の場合には、平均値より大きい値が含まれていることを表し、歪度が大きければ大きいほど、かなり大きい値が含まれていることを表します。
同様に、歪度が0より小さい値の場合には、平均値より小さい値が含まれていることを表し、歪度が小さければ小さいほど、かなり小さい値が含まれていることを表します。
心理統計第4回
試行 trial
同じ条件で繰り返すことができ、それによって結果が決まる行為
事象 event
試行の結果で決まる事柄
確率事象 random event
常にではなく、ある割合で起こる事象
この、ある割合が確率 probability
ある事象が起こる可能性、起こりやすさ、確からしさを表す
ラプラスの原理(定義)
Laplace's principle / definition
理由不十分の法則
無差別の原理
サイコロの目が出る確率1/6
ある目が他の目より多く/少なく出る特別な理由がない
確率の古典的な定義
n件の事象(起こる可能が同じ)のうちのr通りで起こるなら、
その確率は r/n と考える
確率変数 probability variable
確率でその値が決まる変数
量的(連続的)な値 比率、間隔尺度
質的(離散的)な値 順序、名義尺度
確率分布 probability distribution
確率変数の値とその起こりやすさの対応関係
↑
↓
度数分布 frequency distribution
変数の値とその実際に「起こった」度数の対応関係
離散型変数 確率質量関数
連続型変数 確率密度関数
期待値 expected value variance
平均的に期待される値
確率分布の種類
離散型確率分布
一様分布、二項分布、ポアソン分布、ベルヌーイ分布、超幾何分布、多項分布など
連続型確率分布
一様分布、正規分布、指数分布、t分布、x2分布、F分布など
一様分布 uniform distribution 表か裏か、サイコロの目
ベルヌーイ試行 表headと裏tail、1と0、YesとNoのいずれかしか起こらない試行
二項分布 binomial distribution
パスカルの三角形
t分布 t distribution
正規分布にしたがう母集団の平均値の推定で、データ数が少ない場合
・2つの標本平均の差の検定
・標本平均値の信頼区間の推定
x2分布 chi-square distribution
適合性の検定
観察された事象は、ある頻度分布に従っているか?
独立性の検定
観察された2つの事象は、互いに独立しているか?
推測統計学で多く利用される確率分布のひとつ
F分布 F distribution
正規分布に従う2つの群の標準偏差が等しい、の検定
正規分布に従う複数の群の平均値が等しい、の検定など
正規分布 normal distribution
自然、社会、人文科学などを含む多くの現象で観察される分布
統計法でもっともよく使われるもっとも基本的な確率分布
大数の法則 law of large numbers
ある試行を互いに独立に繰り返したとき、実際に観測される事象の起きる割合(経験的確率)は、試行の回数を増やすにともなって理論的確率に近づく
(=標本の平均値が、変数の期待値に近づいていく)
正規分布の根拠
中心極限定理 central limit theorem
xiがどんな分布でもそれらが互いに独立であれば、y(xiの和や平均)は正規分布に近づく(現実にそうであるかどうかは議論の余地ありだがそういう前提でやってる)
言い換えると、母集団がどんな分布に従っていても、
そこから無作為に取り出した標本の平均値(や標本の総和)は正規分布に従う
e 自然対数の底、ネイピア数、オイラー数と呼ばれる超越数・無理数
e=2.71828..
標準正規分布 N(μ,σ2) 平均、標準偏差
μ±σ→68.26%
μ±2σ→95.44%
μ±3σ→99.74%
μ±1.96σ→95%
標準正規分布への変換 z-transformation
z=(x-μ)/σ
正規分布の重要な性質
独立した2つの正規分布する確率変数の和は正規分布する
nが大きいほど平均値のバラツキは小さくなる
心理統計第5回
検定統計量
仮説を判断するための統計指標
算出する検定統計量に応じて、理論的な分布が異なってくる
t検定はt値を算出、t分布になる
F検定はF値を算出、F分布になる
心理統計第6回
1つの平均値の検定とは
1つの標本から得られた平均値を、母集団の平均値としてみなしてよいかを統計的に判断するもの
母集団分散が既知 標準正規分布で
母集団分散が未知 t分布で
心理統計第7回
t検定とは
平均値を比較する際に、特に2つの平均値の差の優位性の検定をおこなう方法のこと、標本の平均値を比較して母平均値に差があるかを推測している
心理統計第8回
決定係数=相関係数の二乗
一方の変量の変化を、他方の変量の変化で説明できる割合
相関係数は、相関の大きさではなく、強さを表す。
図で書いただけでは相関係数に違いがありそうだけども実は同じ、という例
相関係数の値は、対応のある2つの変量の間に、一次式で説明できる対応関係に従っている程度、を表す
心理統計第9回
相関係数はどのくらい信用していいの?
=標本相関係数は,母相関関係とどのくらい一致する?
標本の取り出し方によってrは変わる、が同じことを何度も繰り返せば
その値は0に近いことが多く、大きい値をとることは少ない
相関係数の有意性の検定をしてみよう
帰無仮説、母相関係数は0である
標本は、この仮説の元で無作為抽出されたかどうかを検定
↑
無相関の検定
検定統計量
自由度n-2のt分布
母相関係数の信頼区間の推定
フィッシャーのz変換
信頼区間の下限と上限がプロットできて、rの値からそれを読み取る
順位づけはどのくらい似ているか?
完全一致は+1、正反対は-1
AとBの対象iの順位の積和
AとBの順位づけが同じとき、順位の積和は最大
AとBの順位づけが逆のとき、順位の積和は最小
最大値と最小値の平均値は0
順位の積和から平均値をひいて、最大値と最小値の幅の半分でわると
最大値が1、最小値が0になる
スピアマンの順位相関係数
順位相関係数は、対応する2つの変量の順序の対応性を指標化したもの
スピアマンの順位相関係数の問題点
nが大きいとき、n個の対象全体に順位をつけるのは難しい
その中の2つの対象の間に順序をつけるのはさほどむずかしくない
2つの順位が完全一致なら、係数の値は+1
2つの順位が正反対なら、係数の値は-1
係数の値は、-1と+1の間で、値の増加は、相関の増大を意味する
+
2つの順位が完全独立ならば、係数の値は0
↓
ケンドールの順位相関係数
一致した数から、不一致の数を引く
どちらの順位相関係数も、偏差が正規分布することを仮定しない方法
ノンパラ
心理統計第10回
分散分析 分散の違いを分析して、平均の違いを検定している
t検定は、平均の違いだけではない
無相関検定 相関がない=0との違いを検定している
回帰係数の検定 0との違いを検定している
2つの値の差からこれらの違いを検定するのがt検定
複数の平均値の検定をt検定でやろうとすると検定力が下がる(検定力の劣化)
そこで分散分析
F=平均値間の分散÷誤差分散
F=1分子と分母の分散が同じ
F<1誤差分散の方が大きい
F>1平均値間の分散の方が大きい
じゃあどのくらい1よりも大きいのか?
分散を求める前に平方和と自由度を求める
自由度
データの数が多ければ多いだけ、ばらつきの幅は大きくなる
この数に応じた修正をしなければならない
修正に使われた数が自由度
データの数に依存して決まる値
平方和(ばらつき)
一群の各値からこれらの平均を引いた値の二乗和
バラツキの加法性
全平方和=平均の平方和+誤差の平方和
バラツキ:データと平均との差の二乗和
4水準での一要因分散分析
ランダム要因
10名の参加者はたまたま選ばれた人たち
これらの参加者の違いを明らかにする必要はない
固定要因
4種類のペンの書きやすさの違いがこの研究のテーマ
固定要因が1つの場合
一要因の分散分析あるいは一元配置の分散分析
1つの固定要因が4つの条件で構成されている
この構成要素数が水準
分散の大きな平均値は互いに違う
分散の大きさを判断するためにF検定を使う
心理統計第11回
分散分析で重要なこと
固定要因がいくつあるか考える
釣り合い型と不釣り合い型には気をつける
被験者内要因と被験者間要因の違いを意識する
心理統計第12回
心理学で回帰分析を使うのは
入力→情報処理系としての人→出力
入力と出力の関係から人を推論
刺激としての入力と、反応としての出力との間で直線的な関係を想定
フェヒナーの心理物理学
心理統計第13回
偏相関係数
2者間の相関に対して、もう一つの変数の影響を除いた真の相関
除かれた変数=制御変数
回帰分析のあてはまりで重要なこと
回帰分析のあてはまりを評価するための複数の視点
あてはまりの程度を評価する1
分散分析
残差の変動=残差の二乗和
回帰の変動=回帰直線によって説明される部分
分散分析で有意であれば、データが回帰直線にあてはまってるということ
あてはまりの程度を評価する2
t検定
回帰係数0と求められた回帰係数がどの程度異なっているかの検定
回帰分析と分散分析の違い
回帰分析では、試験成績は量的な得点
分散分析では、単なる分類のためのカテゴリー
分散分析での誤差、得られた各結果とこれらの平均値との差
重回帰分析では、独立変数が複数存在する
2個の場合は、2つの回帰係数が影響し合う、一方の影響を除いたのが偏回帰係数
説明変数が増えれば、それだけ決定係数が高くなる
心理統計第14回
多変量解析
相関係数を元に
「取り込む」=似た独立変数を取り込む
独立変数のまとまりを特定
プロトタイプ論的手法
「分ける」
従属変数との関係の中で独立変数を分ける
従属変数を規定する原因を特定(おいしさ、は何に起因するのかを知る)
因果論的手法
プロトタイプ論的手法
似たもの同士をまとめる、共通要因の特定、心の働きを推論
例)性格類型論、ある性格の人は同じ行動特徴を持っている
この特徴をもたらす心の働きは?
似ていれば相関係数は高いことを活かして、多変量解析でときほぐす
乳酸飲料の試飲テストの例
(順序尺度の結果でやっていいんだね)
主成分分析(縮約と統合)
得られた主成分の中でスコアが最大値のものが特徴的な項目
主成分得点の平均値は0標準偏差1に標準化されている
10個の変数が主成分3個に縮約された
主成分1と2の象限に製品ABの平均値をプロットすると
縮約/統合
1人のデータは10個で構成されてる、これを10以下の数で表現
どの程度の数まで縮約できるか
3つの基準
説明率(累積説明率が50%は欲しい)、
固有値が1以上(説明する変数が1個はあるって意味なのかな)、
単純構造
結果の記述の仕方
どのような基準で主成分の数を特定したのか
主成分負荷行列、固有値、説明率(寄与率)、累積説明率、
各主成分の解釈
因子分析(潜在変数の発見)
主成分分析は相関行列の対角要素は1
因子分析の対角要素は1以下
同じ変数の相関は数学的には1になるはずなのに
なぜ因子分析では1以下になるのか?
直接観測できない変数(因子)が影響して各変数がスコアをとる
性格以外の他の変数でもたらされた特徴である
この因子の影響度を除去するために1以下になる
同じデータを元にした因子負荷行列(回転前)と主成分負荷行列で並べてみると
スコアが変わってるのが確認しやすい(対角要素の相関係数のぶん変わる)
因子軸の回転
隠れた因子を適切に解釈するため、単純構造化するため(解釈しやすくするため)
因果論的手法
反応の原因を明らかにする、心の働きを推論する
結果としての反応が1種類
原因としての刺激が複数
重回帰分析(原因の発見)
主成分分析で得られた主成分をもとに重回帰分析
標準化されていない係数B 傾きにあたる
標準化係数β 標準化する=原点0を通るから切片がない時の傾き
定数=切片
重回帰分析の問題
多重共線性が発生する、2つの独立変数の相関が高い
同じような変数が2回独立変数として使用される、
これは避けたい(信頼のおける結果とはいえない)
多重共線性が気になる場合は、主成分間の相関がゼロである主成分得点を使う
多変量解析で重要なこと
相関係数が重要
プロトタイプ論と因果論の2タイプの手法を理解する
複雑に絡み合っている要因を解きほぐす(心理学、こころのありかは複雑)
心理統計第15回
なぜ心理学に多変量解析なのか?
心理学の対象は人である、人には違いがある、結果は変動する
個人差というやつ、個人差を考える
個人内差 変動をゼロにしたい
個人間差 差に着目する 因果論的アプローチ(発達/性格などの差異心理学)
差の中の共通性に着目 プロトタイプ論的アプローチ
代表的な人(general person)という仮の概念を対象に
知覚や学習などの実験心理学
個人差をなくすために
結果の変動要因
測定結果の変動(疲労、注意、意欲)
内的基準の変動(基準の不安定さ、学習)
評価結果の変動(社会的要因)、いずれも個人内差
変動をなくす努力
noise free situation(多くの練習試行後の安定したデータを使う)
専門評価者の養成(ブレない基準を持ってる人が判定する)
フェイスで個人間差を揃える
統計を勉強する上での3つのつまづき
1)%の意味
95%信頼区間、5%有意水準
10名の結果の平均 平均の95%信頼区間
もしもこれを100回同じことを繰り返したとしたら
10名の結果の平均を100回やったら、
100個の平均が95個入る区間を推定している(推測統計)
2)統計的仮説検定
帰無仮説を否定=確率的に「ほとんど」起こりえない
対立仮説を採用(AB間に違いがあることを期待している)
ほとんど、とは有意水準のこと、
5%有意水準でいうと、100回中5回以下なんてまれだろう、と
3)分散分析
分散の検定は手段である、複数の平均の違いを検定する
t検定=2者間、分散分析=たくさん
複数の平均の分散が大=大きな値から小さな値まで散らばっている、
つまり平均に違いがある
分散の大小の評価、とは誤差分散を基準にしている
何を誤差ととらえるかによって多様な分散分析がある
心理統計法とは
統計は道具です
研究目的を実現するための手段です
間違った使い方をしないようにしましょう
実験や調査で得られた結果を他者に伝える
事前に想定した結果の合否を伝える
検定は伝えるための工夫
想定した内容を検定で明らかにできるような事前設計の必要性
心理学研究法や目的の明確化が大事になってくる
記述統計だけでなく推測統計もできるようになってくるといいんだろうね
記述統計だけだと事実の報告で終わる
提案や将来の予測につなげるには推測統計が使える
記述統計学 すべての個体を調査
推測統計学 標本調査
(2013年6月メモ)