AI用語事典
重回帰分析
Multiple regression analysis
重回帰分析は、ある変数(y)の動きをまた別の変数(x)の動きによって予測する「回帰分析」の一種で、その中でも「結果に影響する原因(説明変数)が複数存在するもの」を指す。結果に対する変数が1つしかない「単回帰分析」に対し、重回帰分析はより一層複雑な解析をすることが可能なのが特徴である。
重回帰分析はExcelでも行うことができ、例えば「売上(y)」に対して「売り場面積」「従業員数」「広告費」(いずれもx)というデータがあったとする。この場合、y→xの順でデータを横一列に並べ、データ分析の項目から「回帰分析」を選んでOKを押せば、重回帰分析が完了する。
あとは結果の読み方が重要となるだろう。係数は偏回帰係数(それ以外の説明変数の数値を固定した時、その変数が1増加するごとに「y」がどれほど増えたり減ったりするか)の推定値を表している。最も見慣れないものに「P値」があるが、これはProbability(確率)の略で、これがゼロに近いほどその係数に意味があるということなので、覚えておこう。
重回帰分析のメリットは、結果に他の変数を含まないためその「x」の純粋な効果が分かりやすいという点が挙げられる。また、単純に単回帰分析よりも有益な結果が得られやすい、連続値のデータを分析するのに適している、なども利点だ。
一方で変数同士で相関関係が強いものがあった場合は適切な結果が得られにくい、変数を増やしすぎると予測の結果が過剰に向上してしまうなどの恐れもある。もちろん“怪奇現象”ではなく、そもそも精度100%はないのが当たり前といえ、その辺りを念頭に入れながら、常に結果と向き合うようにすることが重要といえる。
AI用語解説:×AI編集部監修