-
科学ニュース+
-
【統計学】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング> [すらいむ★]
-
UPLIFTで広告なしで体験しましょう!快適な閲覧ライフをお約束します!
【統計学「p値」の謎】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング>
● 「p値」を理解するための例え
p値の概念は必ずしも直感的ではない。そこで、統計学者が大好きなたとえを使ってみよう。
私はコインの入った袋を持っていて、「コインをめくるとすべて表が出る確率が高いだろう」と考えているとしよう。そして実際、コインを1枚取り出して5回めくるとすべて表が出た。これは何かおかしなことが起きているという、それなりに説得力のある証拠になるだろう。
では次に、最初のコインで5回のうち表が出たのは3回だけで、2回は裏が出た場合を考えてみよう。これは、私の理論の証拠としてはよろしくない。
(以下略、続きはソースでご確認ください)
ダイヤモンド・オンライン 4/5(金) 6:02
https://news.yahoo.c...b757208c5ede930485f1 - コメントを投稿する
-
字数稼ぎの薄くて回りくどい文章
-
意外と知らないどころか今時 p値ハッキングなにそれ?ってやつはヤバイだろ
-
「サンプルが増えれば「偶然」の確率も上がる」との見出しだけでヤバい記事なのがわかる。(確率は変わりません。発生回数が増えるだけです)
-
P値ハッキングどころか、そもそもサンプルした標本データの確率分布を確認して仮定とするモデルと同じ正規分布に従っているかを確認しないといけない。そもそも正規分布に従っても無いのにP値で仮定が正しいか行うこと自体が無意味。確率分布を確認するにはサンプルとして取るデータは何万、何十万と必要だろう。せめて数千ぐらいは取りたいが、実際はこのようなことをしていない。サンプルデータが12個だけという最初から論文にならない論文も沢山見受けられる。にも関わらず査読ではねないのは、査読するものが統計処理を理解していないから。結論を言うと、次のパターンによる誤りだらけ。
1)論文執筆者自身が統計処理を理解していないので機械的にP値検定で結論づけてしまう誤り。物理と数学以外の理系の論文はこれが多いので、結論に全く信憑性がない。地球温暖化も怪しいとノーベル物理賞受賞学者が否定するのも当然。
2)サンプルデータそのものが少ない。20や50程度しか取れない。医学系や生物学系に多いパターン。当然結論は信頼できない。
3)論文執筆者が意図してp値ハッキングする。論外。結論は見る価値もない。 -
論文の数が10000あったらそのうちの500はP値が偶然5%以下になるがそれはいいのかな?
-
>>6
だから(という訳では無いが)論文のメタ解析というのがある -
>>1は、一昨年昨年に全国大学に量産された「データサイエンス担当教員」(ほぼ全員、文学研究者か、データサイエンスの講義は受けたことのないIT屋)に、ぜひ読ませたい記事だ
悶麩蚊顎症が唯一、文系私大で認めたデータサイエンスの重点大学のカリキュラムと講義内容と教員たちをよく知っているのだが、
>>1の内容どころか、Rを知らないどころか、excelのマクロを使えないため、
学生に解析させて無償で巨大企業に提供して大学が稼ぐデータを、すべて手作業で処理している
学生への教育が、数年すれば使えなくなる目先のテクニックだけなのはいうまでもないが、これが、
大学の経営者(資産家で大手企業の株主様)や、紋武火画苦笑の高級官僚(灯台学部の落ちこぼれの成れの果て)には大受けしているらしい
富裕層がどうなろうと折れの知ったことではないが、学生にマトモなデータサイエンス教育が施されるには、
データサイエンス担当教員つまり文学者や市井のIT屋が、>>1の記事を読んで、内省することが不可欠だとおもう -
科学板にダイヤモンドソースでスレ立てするなよ…
-
何が本当で何が偽物化があやふや院なる
全ての論文該当しそうなのですが・・・
今の科学も確率論で一番再現率の高いものを使用している
でも真実は再現できていないもありうるのですね
全員統合失調症の幻覚!とあるとなることも考慮する必要がある -
p値
木兆 -
統計つかうなら知らない奴いないだろ
-
フィッシャーが一生のうち一回くらい間違えてもいいよね。ってくらいの発想だから
-
この手の「p値だけを見るのは危険」って言うやつってたいてい効果量まで言及しないよなぁ
雑魚ばっか -
世の中n=1とか因果関係と相関関係の区別できない奴とか
ゴロゴロしてるからp値とか早すぎる -
今の日本の理系としては
この記事をできるだけ多くの理系学生に読んでほしいと思うは
教員がこれを知らないというのが現在の日本の大学のデフォルトなので -
ノンパラ検定やればいいだけじゃね?
-
事象Aが有であったときに事象Bであった
事象Aが有であるのに事象Bがなかった
事象Aが無であるのに事象Bであった
事象Aが無である時に事象Bもなかった
知らんけど -
ピーチク
ビーチク -
最近はp値使ってる論文は受け付けませんってジャーナルもあるんでしょ
-
3試合連続
-
なぜ検定では5%水準とか1%水準を使うのか、それらの数字の根拠を述べよ。(5点)
-
なぜ配点が5点なのか
-
two one-sided testでも、許容できる誤差は自分で決める
↑今すぐ読める無料コミック大量配信中!↑