豊田秀樹 2017
HMC法 ハミルトニアンモンテカルロ法
物理学分野の力学的エネルギーの原理を応用したMCMC法の一つの方法
生成
HMC法は、同時事後分布に従う乱数を、蛇口から水が流れるように継続的に生成する
捨てる区間 burn in
乱数の数 chain
点推定量
事後期待値 EAP
事後中央値 MED
事後確率最大値 MAP
事後分布が正規分布だったら平均値と同じだし、EAP=MED=MAP
一様分布だったら最尤値と同じ=標本平均と同じ
点推定値の精度
事後分布の散布度(分散や標準偏差)の小ささ=点推定値の精度
第3回
MCMC法
事後分布に従うパラメータを乱数として発生させ、パラメータを確率分布として表すHMC法 ハミルトニアンモンテカルロ法
物理学分野の力学的エネルギーの原理を応用したMCMC法の一つの方法
生成
HMC法は、同時事後分布に従う乱数を、蛇口から水が流れるように継続的に生成する
捨てる区間 burn in
乱数の数 chain
点推定量
事後期待値 EAP
事後中央値 MED
事後確率最大値 MAP
事後分布が正規分布だったら平均値と同じだし、EAP=MED=MAP
一様分布だったら最尤値と同じ=標本平均と同じ
点推定値の精度
事後分布の散布度(分散や標準偏差)の小ささ=点推定値の精度
第?回
検定力分析適切な検定ができるようにサンプルサイズを決める
大きすぎず小さすぎずに
でもそれって順番逆じゃね?
サンプルサイズは実験者が主体的に決めることだべ
第10回
有意性検定は結果がシンプルでいいブラックボックスでもいい
統計熟知してない人には特にそう思われやすい
有意水準を絶対的なものとして捉えちゃうので
でも本当は同じ5%でも、
サンプル数が多くてp<0.05になった場合(第一種の過誤が起きてる)もあれば、
サンプル数が小さくてp>0.05になった場合(第二種の過誤が起きてる)場合もあるのに、絶対唯一視されてしまうという危険性がある
サンプル数が多くて無意味な場合
サンプル数が少なくて意味のある差を検出できない場合
差がある確率は80%といわれると解釈は人によって分かれる
書いた人が差があると思っても査読者はそう思わないかもしれない
だが判断を各自が自在にできるのがベイズ推定のよきところともいえる
サンプルサイズで結果の意味が変わることはない
ABテストの結果、AがBを上回る確率は60%でした、と報告する
BをAに切り替えるのにほぼコストがかからないのであれば、Aに切り替えようという判断がしやすい
一方、AB間に差があるとはいえない、と報告する
BをAに切り替えるのにほぼコストがかからないとはいえ、どっちつかずの報告ではAに切り替える判断はしにくい
その結果、Aに切り替えていれば60%の確率で売上が増えたかもしれない未来を捨てている、機会損失が起きている
でもそのこと自体に気づかないままに時は過ぎていく、これが怖い
チームAがBに勝つ確率が0.2と予想されている場合は
0.2 / (1-0.2) = 1/4となる
Aが勝つと予想している人が、Bが勝つと予想している人の1/4である
オッズ比=賭けに勝った人の払い戻し倍率の逆数ともいえる
Aに1,000円賭けてAが勝った時は、外れた人の掛け金をみんなもらい
元金+4000円をもらえる
2項分布の掛け合わせ(2x2のクロス数表、男女別のブランド認知率)
男女間にブランド認知に差はあるか?などを調べる場合は
リスク差、リスク比、オッズ比をみる
有意性検定のカイ二乗検定と同じ
だが説明変数では説明しきれない目的変数の特徴を考察することも大事、そのためには残差プロット
ある2つの観測データにおいて、説明変数の値は同程度なのに、残差に大きな違いがあったりする、その違いが何かはわからない
でもその違いはなぜかを考えることにより新たな別の説明変数を着想するきっかけになる
残差プロットは新しい研究視点を与えてくれることもあり、観測対象に対する有用な知見を示してくれる
サンプル数が小さくてp>0.05になった場合(第二種の過誤が起きてる)場合もあるのに、絶対唯一視されてしまうという危険性がある
サンプル数が多くて無意味な場合
サンプル数が少なくて意味のある差を検出できない場合
差がある確率は80%といわれると解釈は人によって分かれる
書いた人が差があると思っても査読者はそう思わないかもしれない
だが判断を各自が自在にできるのがベイズ推定のよきところともいえる
サンプルサイズで結果の意味が変わることはない
ABテストの結果、AがBを上回る確率は60%でした、と報告する
BをAに切り替えるのにほぼコストがかからないのであれば、Aに切り替えようという判断がしやすい
一方、AB間に差があるとはいえない、と報告する
BをAに切り替えるのにほぼコストがかからないとはいえ、どっちつかずの報告ではAに切り替える判断はしにくい
その結果、Aに切り替えていれば60%の確率で売上が増えたかもしれない未来を捨てている、機会損失が起きている
でもそのこと自体に気づかないままに時は過ぎていく、これが怖い
第11回
オッズ比 odds = p / (1-p)チームAがBに勝つ確率が0.2と予想されている場合は
0.2 / (1-0.2) = 1/4となる
Aが勝つと予想している人が、Bが勝つと予想している人の1/4である
オッズ比=賭けに勝った人の払い戻し倍率の逆数ともいえる
Aに1,000円賭けてAが勝った時は、外れた人の掛け金をみんなもらい
元金+4000円をもらえる
2項分布の掛け合わせ(2x2のクロス数表、男女別のブランド認知率)
男女間にブランド認知に差はあるか?などを調べる場合は
リスク差、リスク比、オッズ比をみる
有意性検定のカイ二乗検定と同じ
第13回
単回帰分析における回帰直線は、目的変数と説明変数のおおまかな関係を示してくれて便利だが説明変数では説明しきれない目的変数の特徴を考察することも大事、そのためには残差プロット
ある2つの観測データにおいて、説明変数の値は同程度なのに、残差に大きな違いがあったりする、その違いが何かはわからない
でもその違いはなぜかを考えることにより新たな別の説明変数を着想するきっかけになる
残差プロットは新しい研究視点を与えてくれることもあり、観測対象に対する有用な知見を示してくれる
0 件のコメント:
コメントを投稿