2017年1月22日日曜日

ベイズ的推測の例

(少し勘違いが混じってるかもしれない)

ある企業が、売上向上を目的に製品カタログの見直しを検討
従来カタログでの購入金額平均は2,500円
新カタログをとりあえず20人に試したもらったところ平均2,900円だった
さて、カタログは切り替えた方がよい?
(それとも20人の平均額はたまたま高かっただけとも考えられるから切り替える必然性は薄い?)

従来型の統計学だと
現カタログと新カタログの購入額平均に差はない、という帰無仮説を
平均値の検定(t検定)で検証する
t=2.52 p=.02にて帰無仮説が棄却されれば、新カタログがよさそう、とはなるが「平均に差はない、とはいえない」を検定しただけであって、切り替えた方がよいかどうかを直接的に検証してるわけではない点がもどかしい

これがベイズ的アプローチになると
新カタログの平均2,900円が現カタログ2,500円に比べて高い確率は98.7%と出力される

95%信頼区間:2,572円〜3,281円(幅709円)と言ってるか
95%確信区間:2,560円〜3,279円(幅719円)と言ってるかの違い、つまり数値情報としてほぼ同じなのだが、ベイズ的な結果出力の方が、すっとわかりやすい。

信頼区間は、今回のデータによって、一定の危険率で棄却されない母数値の範囲であり、公式によって(場合によってモンテカルロ法で)計算可能

確信区間は、(事前の主観確率を一様分布等とした時に)母数が一定の確率で入る範囲であり、モンテカルロ法によって(場合によって公式で)計算可能

どちらが正しいかではなく、どちらが便利か、どちらを選択するかである


0 件のコメント: