AI用語事典
k近傍法
k nearest neighbor algorithm
k近傍法は機械学習の分類法のひとつで、あらゆるアルゴリズムの中で最もシンプルとされる。基本的には事前にデータ(サンプル)をコンピューターに与えることにより機械学習を可能にする「教師あり学習」に使われるのが特徴で、流れとしては以下の通りである。
■k近傍法の方法
まず、属性がはっきりしている「グループA」と「グループB」というデータの集合体があり、座標上にそれぞれが散らばっていたとする。
例えばそこに「X」という新たなデータがやって来た場合、まずその「X」の位置がグループAとグループB、どちらにより近いのかを見る。範囲(k)をある程度指定し、円で括ってみると分かりやすい。同じ円の中にはグループAとグループB、どちらが多いだろうか?
つまりk近傍法とは、「k」の値(例えばk=3なら直近のデータから3つを選ぶ)をあらかじめ指定した上で、その範囲内で数が多い方に「X」を分類する方法なのである。簡潔に言えば多数決、というわけだ。
k近傍法は、単純かつ明瞭な方法なのでどのようなデータにも活用でき、モデルの構築が速いことがメリットと言える。一方でkの値が適切でなければ予測の結果が変わる、訓練のデータが多いほど時間がかかる(精度も下がりやすい)というデメリットも存在する。
活用方法としては手書きの文字をコンピューターに認識させたり、顧客の購買意欲をデータから予測したりといったものが挙げられる。明確なデータに基づいた教師あり学習なので、局所的な推測に適切な方法として覚えておこう。
なお、混同されがちなK平均法(k-means clustering)はクラスタリングの手法の一つで、教師なし学習。つまり、データを前提としない。
AI用語解説:×AI編集部監修