重回帰分析をした際に、R^2値が大きかったり分散分析の結果が有意だったとしても、偏回帰係数が有意ではない説明変数が多い場合ではその式は信頼できないのでしょうか?
また、個々の説明変数が有意でないのに、モデル全体としてみるとデータにフィッティングしてるのは何が原因なのでしょうか?
>>>重回帰分析をした際に、R^2値が大きかったり分散分析の結果が有意だったとしても、偏回帰係数が有意ではない説明変数が多い場合ではその式は信頼できないのでしょうか?
必ずしもそうとは言い切れないです。ドメイン知識によっては、説明変数に組み入れることがあります。清潔習慣病の判定モデルで、LDLコレステロールは、有意ではないことがしばしばですが、組み入れられます。この辺りは、ドメイン知識により、一概に言えないです。ただし、有意でない説明変数が含まれているとモデルが不安定になりやすいです。
>>>また、個々の説明変数が有意でないのに、モデル全体としてみるとデータにフィッティングしてるのは何が原因なのでしょうか?
原因は、いろいろありますが、多重共線性や、交互作用が関係してくることが多いです。したがって、多重共線性や、交互作用を考慮した変数選択を検討するといいと思います。
参考サイト
https://www.nikkei-r.co.jp/glossary/id=1631
|