線形回帰分析の結果です。各パラメータの意味は以下の通りです。
Total sum of squaresは、全変動平方和 、Residual sum of squaresは、残差平方和
、Regression sum of squaresは、回帰変動平方和
です。
であり、
の関係があります。
RMSE(Root Mean Squared Error)は、、MAE(Mean Absolute Error)は、
、MAPE(Mean Absolute Percentage Error)は、
です。値が小さいほどモデルの当てはまりがよいことを意味します。
R-squared(決定係数、寄与率)は、、Adjusted R-squared(自由度調整済決定係数)は、
であり、Adjusted R-squared 2(自由度二重調整済決定係数)は、
です。1に近いほどモデルの当てはまりがよいことを意味します。自由度調整は、説明変数数kの増加に比例して重回帰モデルの当てはまりが良くなる傾向を補正します。
log(Likelihood)は、であり、回帰式の誤差項が平均0、分散
の正規分布に従うとしたときの対数尤度です。
は、残差平方和を使用します。
AICは、赤池情報量基準 、杉浦のexact AICは、
であり、値が小さいほどモデルの当てはまりがよいことを意味します。AICは、線形回帰に限らず、一般の確率モデルに対してモデル選択基準として適用できますが、パラメトリックな分布に制限する必要があります。
p-value (F-statistic)は、帰無仮説を「母集団におけるモデル全体としての説明力が0」とするp値です。有意水準以下のとき、説明力は0ではない、と解釈します。
p-valueが有意水準以下のとき、係数は0ではない、と解釈します。
予測した回帰式に全ての説明変数の値を適用した結果を表で表示します。
y^l、y^uは、予測値y^の95%信頼区間であり、で算出されます。φeは、(データ数)-(説明変数数)-1、D02は、マハラノビス汎距離です。区間幅は、RMSEの4倍に近い値になります。
esは、標準化残差(Standardized residuals)、
であり、値が-2~+2のときモデルの当てはまりがよいと判断できます。そうでないとき外れ値の可能性があります。
Lは、テコ比(Leverage ratio)であり、サンプルiのテコ比は、 で得ます。2.5×(k + 1)/n以内が基準値です。基準値外のとき、重回帰式の超平面がテコの影響を受け全体を引っ張るという悪影響を与えている可能性があります。表内の基準値外のセルを強調表示します。
説明変数の組み合わせを総当り(べき集合)で回帰式を予測し、評価した結果を表で表示します。
R-squared(決定係数、寄与率)は、、Adjusted R-squared 2(自由度二重調整済決定係数)は、
です。1に近いほどモデルの当てはまりがよいことを意味します。自由度調整は、説明変数数kの増加に比例して重回帰モデルの当てはまりが良くなる傾向を補正します。
RMSE(Root Mean Squared Error)は、です。値が小さいほどモデルの当てはまりがよいことを意味します。
多群の平均値の一致性を検定する一元配置分散分析です。全群の等分散を仮定します。p値が有意水準以下のとき、平均値が異なる群を含む、と解釈します。この検定では、分散が異なる群を特定することはできません。
BSS-dofは要因に関する自由度、WSS-dofは残差に関する自由度であり、F_0は一元配置分散分析における検定統計量です。帰無仮説が正しいとき、F_0は自由度(BSS-dof, WSS-dof)のF分布に従います。
データの対応のある多群の平均値の一致性を検定する一元配置分散分析です。全群の等分散を仮定します。p値が有意水準以下のとき、平均値が異なる群を含む、と解釈します。この検定では、分散が異なる群を特定することはできません。
BSS-dof・USS-dof・WSS-dofはそれぞれ要因・個体・残差に関する自由度であり、F_0は一元配置分散分析における検定統計量です。帰無仮説が正しいとき、F_0は自由度(BSS-dof, WSS-dof)のF分布に従います。