●仮定
・製品AとBの規格値が正規分布に従っていて、分散一致(平均値は明らかにAの方が高い)
●課題
・製品Aからどんなサンプルを取ってきても、製品Bのどのサンプルの値よりも値高くなるだろう、ということを証明したい
・これにより、製品Aの検査を省略できるか判断したい
●質問
・「平均値の差の検定をt検定で行い、p値が極めて小さいことを以て判断する」のは、この課題に対して有効でしょうか?
●自分の考え
・この問題は平均値の差の問題ではなく、標本分布そのものの差の判定になるので、(必要条件にはなるかもしれませんが)この検定では不十分と考えました。
・一方、この問題に対応する検定方法がわかりませんでした。検定に頼らない方法であれば、それぞれの標本正規分布を求め、製品Aの標本分布からサンプリングした時に、製品Bの過去最大値を超える確率を求める(分布の差が十分にあれば、ほぼ1になる)と思ったのですが、検定で対応する方法や、他にもこういう方法があるよというものがあれば、助言いただけないでしょうか?
補足1 投稿日時:2021/06/18 11:46
規格値は高い方がよいものになります(望大特性)。
補足2 投稿日時:2021/06/22 8:49熊坂様
ありがとうございます。間違っていたらご指摘願います。
今回の課題は平均値に差があることを見たいのではなく、(任意の製品A規格値)>(任意の製品B規格値)であること(大雑把に言うと両者のヒストグラムは重複しない)を検証したいと考えています。もちろん、正規分布やt分布を確率分布とした場合、確率変数の区間が(-∞,∞)なので、数学的に重複しないことはありえない、というのは理解しています。
教えていただいた手法の場合、帰無仮説としては製品Aや製品Bの平均値を検定統計量として持ってくるのではないかと捉えており(間違っていたらご指摘いただきたく存じます)、それだと命題の検証としては不十分と考えました。
このような課題の場合、スペック値があればCpやCpkを使う方が定石というのも理解しましたが、統計の枠組みで上の命題を検証する方法があれば、教えていただけたらと思います。
これはSQC(統計的品質管理)の典型的な検定問題です。
https://www.monodukuri.com/gihou/article/612
両製品の分散は同じ正規分布としていますが、それらのデータ数は有限ですから、ここでは母分散未知のt検定とします。
帰無仮説は:製品Aと製品Bの特性には差がない
対立仮説は:製品Aの特性は製品Bのそれよりも高い
統計量を求めて帰無仮説が棄却されるかどうかを判定しますが、たとえ棄却された場合でも、対立仮説が必ず成り立つわけではありません。
両製品の特性が統計量である限り、サンプルを取り直せば完全な同一にはなりませんから、p値が0(サンプル数無限大)でない限り、製品Bの特性がAよりも高くなる確率が必ず残ります。
「検査の要否判断」が目的であれば、製品Bとの比較というよりは、むしろ検査のコストと、不良品流出で生じるコストの比較が合理的であり、まぐさんがもうひとつ質問している問題と同じく損失関数で判断することになります。
たとえ不良品が流出しても、それによって生じる社会損失が検査コストより少なかったら許してもらおう(その分価格が安いですよ)という論理です。
どうしても顧客が不良ゼロを求めるのであれば、全数検査するのは構わないですが、その分の費用は価格に反映することになります。それでもご存知のように、流出不良は減るもののゼロになりません。
別の回答と重複しますが、飛行機、原発、医療機器など人命にかかわる製品や、ロケットなど問題発生の損失が超高額の構成部品は、最適不良率が極めて低くなります。
事業活動はすべて経済的に判断されるべきものです。
ただし利用時に社会損失が発生しないとしても、不良があまりに多いとユーザーの信頼が下がって他の関連製品まで売れなくなったり、発注元から契約打ち切りになるリスクもあり、これらも忘れずに計算に組み込む必要がありますが、これらの金額換算はなかなか簡単ではありません。
|
まぐさん、こんにちは。難しい問題ですね。
平均値の差の検定で、p値はデータ数に依存します。勿論二つの分布がどのくらい離れているかでも異なります。
二つの分布が完全に重ならないというのは、正規分布を仮定する場合あり得ないですよね。それなら6シグマ以上離れているかを調べたらどうでしょう。平均値が6シグマ離れれば、重なりは0.3%くらいになると思います。医療の世界では一般に判別の閾値を2D(標準偏差の2倍)として検定条件を設定します。これは危険率5%とほぼ同じです。
参考文献はこちら:https://www.jstage.jst.go.jp/article/jjb/29/Special_Issue_1/29_Special_Issue_1_S99/_pdf
回答になっているかどうかわかりません。
|
最終的な目的が「製品Aの検査を省略できるか判断したい」であることから、おそらく製品Bは現在検査していないのだろうと推察しました。
製品Bが検査しているのであれば、それより特性が良いからといって検査を省略するわけにいかないからです。
だとすれば製品Aが統計的に製品Bより優れていることを示せば十分であり、平均値の検定問題になります。
ただし100万データの検定で差があるとなっても、生産現場は材料、環境、作業などが変化しますから、将来的にその結果が継続される保証はありません。
無検査で不良品が通過した場合の損害額と対応を頭に描いておくようにし、致命的な事態が予想される場合は検査した方が良い場合もあるでしょう。
これは現在検査していないかもしれない製品Bでも同様です。
また深澤さんが書いている通り、危険率0%の統計量はありません。0.1%にするためにも相当数のデータが必要ですから、実際には検査しながら危険率が十分下がるためのデータを集めることになりそうです。
|