それとも、ランダムに行うべきでしょうか?
またデータn数ですが、いくつ以上あるのが望ましいのでしょうか?
それぞれ、n1ではだめなのでしょうか?
また、そのn数のデータは連続で採取していいのでしょうか?
直交表の実験順番と反復数についてのご質問ですね。
より実験結果の信頼性を上げるために、英国の統計学者Fisherは次の3原則を提起しました。
(1)局所管理化
(2)反復
(3)無作為化
実験の順番についていえば(3)を適用して、ランダムに行った方が良いことになります。
しかし工業実験の場合、因子によっては切り替えに大きな時間、費用が掛かる場合があります。
例えば温度を上げるのは容易だが、冷ますのに時間がかかったり、濃度を下げるには薄めれば良いが、上げるには作り直す必要がある場合などです。
その場合は、その要因だけは容易な水準変更になるように、実験順番を設定することを勧めます。その代り、実験順番やその他気づいた事項はしっかり記録に残し、奇妙な結果が出た時に原因を調査できるようにしておきます。
水準変更が大変な因子が3個以上あると、上記のやり方でも実験が手間取ることになります。
直交表各列あたりのデータ個数については、前記の原則(2)によれば多いほど良いことになります。もし条件変更の時間、費用に比べてサンプル作成の時間、費用が十分小さいなら複数個作るに越したことはありません。射出成型などがそれにあたります。
ところが同条件であってもサンプルを2個作るとしっかり2倍のしかも高額の費用が掛かる場合は、1個で評価することを勧めます。例えば私が以前担当していたプラズマディスプレイパネルなどは、1個試作するのに50万円、2週間ほどかかりました。L18直交表で実験すると900万円、2個ずつ作れば1800万円です。
2個ずつ作っても分散分析で実験誤差の精度が上がるだけです。因子を割り付けない「誤差列」を設けることで、反復しなくても因子効果の有意差判定は可能です。
AATさんの質問への回答としては、「ケースバイケース」ということなのですが、具体的には下記の記事が参考になるでしょう。
http://www.monodukuri.com/gihou/article/73
複数個のサンプルを取る場合も、原則(3)に従って、36個ばらばら順に作れば信頼度は上がりますが、それこそ間違いなく大変な作業になります。特定因子の水準変更方向性に効果が予想される場合などは、それ自体を因子に入れるなどの工夫をして、一般的にはサンプル作成に大きな支障がない範囲でのランダム化に留めておくのが良いでしょう。
先ほどの射出成型の複数サンプルも、連続成型だから簡単なのであって、1個ずつランダムに作ろうとしたら大変です。
ただし誤差を評価する場合は、連続とランダムで変わってきます。
|