ある系における性能を重回帰分析により数式化しようとしています。
4因子3水準で直交表を利用し、その結果を回帰分析する予定です。
このような状況で、以下2点ご質問があり、アドバイス頂けると幸いです。
①4因子3水準なのでL9直交表を検討していますが、
・重回帰分析に必要なデータ数が9で少ない
・交互作用と主効果の交絡により、交互作用の影響が分からない
という理由により相応しくないと考える反面、最小規模で推進できます。
今回誤差因子を振ってないので、交互作用の影響を利得ではなく
測定値で見ることは正しいでしょうか。
それとも、データ数が少ないためL18やL27を利用した方が
良いでしょうか。
②L18直交表を利用する場合、4因子分の4列を使用し、
その他の列を空けようと思います。
この場合、交互作用の影響は空けた列の要因効果図の傾きで
判断しても良いのでしょうか?
それとも、L27直交表(13因子3水準)に交互作用の列を設けて、
実験計画法により交互作用の影響を分析し、交互作用が少なければ、
重回帰分析に活用するという方法が良いでしょうか。
9通りの実験で終わるのが理想ですが、正確な予測式を出すためには、
急がば回れの精神も必要と理解しており、今後の進め方の参考にさせて
頂きたく思います。
質問が長くて恐縮ですが、アドバイスお願い致します。
補足1 投稿日時:2022/01/11 15:15
村島様
早急なご回答有難うございました。
重回帰分析をする理由:各要因と知りたい変数の関係が分からず、予測式を確立して
今後の検討に利用したいためです。
また、現時点では交互作用がどうなるか、分かっておらず、
重回帰分析が最も扱いやすく、直交表と相性が良いと感じました。
要因から予測式を導出する方法として他に良いやり方がありますか?
データ数を増やす必要がある点、理解しました。
繰り返し数もデータに含んで良いと考えますが、正しいでしょうか?
例えば、L18を3回実施して54(3×18)データで分析するという意味です。
村島様
お世話になっております。
色々アドバイス有難うございました。
調べているのですが、直交展開やT法に関する情報があまりなく、
どのように計算すれば良いか、お薦めの文献や資料など、
教えて頂けると大変助かります。
多変量解析、品質工学、実験計画法、信頼性工学等のコンサルやセミナーを実施しております村島です。ご質問の件、なぜ、重回帰分析を使わないといけないのかが、いまひとつ、よくわかりませんが、直交実験で重回帰分析をつかって、メリットがあるのは、各列、文字通り直交していますから、その相関行列はゼロであって、説明変数間相関係数の高さからくる多重共線性の危険性は全くないということです。逆に言えば、分散分析の結果と一致するので、重回帰分析の独自有用性はないともいえます。又、データ数からいいますと、重回帰分析は、実用上、実践上、説明変数の10倍程度は必要です。よって、4因子であれば、40個は必要です。(単回帰でも、50個は必要といわれていますから、4因子40個では、これでも少ないかと思われます。)
データ数が少ないならば、重回帰分析の結果は、見かけの回帰式になることが多く、実用に耐えません。もし、実用に耐えるのであれば、その重回帰分析の結果が直交実験の分散分析に一致したというだけのことです。
まとめますと、
①については、重回帰分析するうえで、データ数からして、L18やL27では足りません。最低でも、40個、です。
次に、要因効果図と交互作用についてです。
②L18の要因効果図から、山形、谷形から、交互作用有無を判断する、というのは、一部の品質工学者で言われていますが、そういう場合に交互作用が多いことがある、という経験則で、数理的には全く保証されない話です。あまりお勧めできません。
後半の、L27をつかって、交互作用を検証し、交互作用が少なければ重回帰分析に移るというのも、大きな誤解があります。
交互作用があってもなくても、重回帰分析は成立します。交互作用の式が分かって、一次変換できるのであれば、という前提です。又、①とも関係しますが、交互作用がない(少ない)というのであれば、なにも重回帰分析してみるより、直交実験の分散分析や、高次直交展開するという実験計画法のほうが、判断ミスしにくい分、重回帰分析より優れています。
当サイトの私のオンデマンドセミナーでも、重回帰分析の危険性や正しい実践方法、実験計画法と交互作用について詳細説明してますので、そちらも、ご覧いただければ幸いです。
|
補足質問についてです。
直交実験と最も相性の良い予測は、直交展開です。また、T法もいいです。
重回帰のデータ数は、繰り返しで結構です。実験繰り返しで構いませんが、この場合でも、直交展開の方がいいです。
|
直交展開のあとの、直交多項式を使いますが、実験計画法の本を見て下さい。基本的な本なら、大抵の本で載っています。T法は、よくわかるMTシステム、日本規格協会、田村がわかりやすいです。読まれてから、わかりにくい点を、再度、質問して下さい。
なお、当サイトの私のオンデマンドセミナー、製造業でやさしく役に立つ数理的問題解決法10選の第2回で、重回帰分析やT法を詳細説明しています。ご活用下さい。
|
ご質問に対して、既に回答が成されているため、少し違った視点で回答させて頂きます。「ある系における性能を数式化」を「ある系の特性yを要因X=(x1,x2,x3,x4)で数式化」と読み替えてお答えします。
大文字Xはベクトル、小文字x1~x4は変数(因子)とします。
1. y=f(X)としたとき、f(X)が多項式であるか、あるいは非多項式(指数関数や対数関数)か、まず検討します。前者はSQC(統計的品質管理)で扱うことができ、後者は物理学や化学で扱うことが多いでしょう。本サイトではSQCを前提とすることが多いので以後多項式を検討します。ただし、物理や化学の知見から、前提となる式f(X)が存在するならば、まずそれを基本として、その式を多項式に変換するアプローチも残されています。
2. 多項式の場合、次数を検討します。x1~x4全てを2次まで評価する必要があれば、それなりの実験を計画します。3次や4次を検討することも可能です。しかし固有技術の視点から明らかに1次項の評価で十分ならば、その前提であらかじめ変数を選択(絞り込む)ことができます。この「固有技術による絞込み」は実験者に大きく依存しますが、現場重視のSQCならば可能ではないでしょうか?。
3. もし2次までの評価であれば、評価因子の数=f(X)の項の数は、最大で、定数項1、主効果(1次項)4C1=4、交互作用(積項)4C2=4×3/2=6、2次項4C1=4なので15であります。すなわちパラメータ数は最大で15です。
3. 15のパラメータを求めるためには最低でも15個の独立したデータ、即ち独立した実験が必要です。統計的なアプローチであれば誤差を評価するとしてN回の実験を加えます。ここで「独立」を説明することは紙面の都合で省略し、その実現方法として統計解析ソフト(例えばJMPやStatWorks)を使う、とさせて下さい。
4. 以上のように15のパラメータを求める(15+N)回の実験を統計解析ソフトで計画、実施するときのキーワードは最適計画(Optimum Design)です。これはコンピュータを使って、ある基準のもとに計画を作成します。L9, L18等の直交計画のように因子を独立に評価することは困難な場合が多いのですが、それを前提に実験回数を小さくすることが可能です。
前述の「固有技術による絞込み」が可能ならば実験回数は(15+N)-(評価から除外した変数の数)となります。
5. 得られたf(X)を使って確認実験を行い、ある基準(実験者が決めます)で数式化が達成されたか否かを評価します。数式化だけがが目的であるならば、このような方法もあります。参考になれば幸いです。
|