論文執筆中の学生です。回帰分析について質問させていただきます。
因子分析(最尤法斜交プロマックス回転)をして算出した因子得点を用いて重回帰分析を試みました。しかし、定数の有意確率が1.000、4つの独立変数の有意確率が0.000という結果になりました。この結果の読み取り方を教えて頂きたいです。これはそもそも斜交プロマックス回転が相関関係があることを前提としているため、算出された因子得点を用いて重回帰分析を行うことにはむいていないということでしょうか。
質問>定数の有意確率が1.000、4つの独立変数の有意確率が0.000という結果になりました。
例えば、Rでの出力でいうところのPr(>|t|)の部分が、(Intercept)が1、xが0であったということだと思います。
------------出力例ここから
> summary(ans)
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-7.3947 -1.9561 -0.0351 1.0439 8.6842Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.59649 2.60529 0.229 0.8254
x 0.23596 0.07739 3.049 0.0186 *
—
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 4.771 on 7 degrees of freedom
Multiple R-squared: 0.5705, Adjusted R-squared: 0.5091
F-statistic: 9.297 on 1 and 7 DF, p-value: 0.01861
------------出力例ここまで
この部分は、回帰係数がゼロでないことを検定しています。
単回帰の場合、 y = B0 + B1x1 + e という数式を当てはめた場合に、B1がゼロでないことを検定しています。帰無仮説は、H0: B1 = 0で、B1は正規分布に従い、検定統計量 B1/s.e.(B1) は、H0の下、自由度n-2のt分布に従います。s.e.は、上記Rの出力でStd. Errorを、B1/s.e.(B1) は、上記Rの出力で t value に対応し、その検定結果がPr(>|t|)に出力されています。
重回帰の場合、 y = B0 + B1x1 + B2x2 + B3x3 + e という数式を当てはめた場合に、B1,B2,B3のそれぞれ(ここではBjとします)がゼロでないことを検定しています。帰無仮説は、H0: Bj = 0で、B1は正規分布に従い、検定統計量 Bj/s.e.(Bj) は、H0の下、自由度n-p-1(pは回帰係数パラメータの数)のt分布に従います。s.e.は、上記Rの出力でStd. Errorを、Bj/s.e.(Bj) は、上記Rの出力で t value に対応し、その検定結果がPr(>|t|)に出力されています。
Pr(>|t|)がゼロであるということは、H0: B1 = 0が棄却されますので、回帰係数が有意であるということであると思います。Pr(>|t|)が非常に小さい場合は、 ‘***’ のフラグがつきます。この質問の場合、重回帰は一応うまく行っていますね。
質問>斜交プロマックス回転が相関関係があることを前提としているため、算出された因子得点を用いて重回帰分析を行うことにはむいていないということでしょうか。
一般論としてはそういうことも言えると思います。ただ、個々のケースによって状況は違ってくるので、変数選択の場合に、交互作用を考慮したモデルを作って、交互作用項が有意でないことを確認したのちに、交互作用項を除いたモデルを試すとか、分散拡大係数(variance inflation factor, VIF) を調べて多重共線性がないかなどを検討されるといいのではないでしょうか?
|
重回帰の部分1箇所だけタイポなので、訂正させてください。
帰無仮説は、H0: Bj = 0で、Bj は正規分布に従い、検定統計量 Bj/s.e.(Bj) は、H0の下、自由度n-p-1(pは回帰係数パラメータの数)のt分布に従います。
|