k近傍法とは・AI関連用語集

k近傍法とは、意味や概念を詳しく解説

menu

×AI

AI用語事典

k近傍法

k nearest neighbor algorithm

k近傍法は機械学習の分類法のひとつで、あらゆるアルゴリズムの中で最もシンプルとされる。基本的には事前にデータ(サンプル)をコンピューターに与えることにより機械学習を可能にする「教師あり学習」に使われるのが特徴で、流れとしては以下の通りである。

■k近傍法の方法
まず、属性がはっきりしている「グループA」と「グループB」というデータの集合体があり、座標上にそれぞれが散らばっていたとする。

例えばそこに「X」という新たなデータがやって来た場合、まずその「X」の位置がグループAとグループB、どちらにより近いのかを見る。範囲(k)をある程度指定し、円で括ってみると分かりやすい。同じ円の中にはグループAとグループB、どちらが多いだろうか?

つまりk近傍法とは、「k」の値(例えばk=3なら直近のデータから3つを選ぶ)をあらかじめ指定した上で、その範囲内で数が多い方に「X」を分類する方法なのである。簡潔に言えば多数決、というわけだ。

k近傍法は、単純かつ明瞭な方法なのでどのようなデータにも活用でき、モデルの構築が速いことがメリットと言える。一方でkの値が適切でなければ予測の結果が変わる、訓練のデータが多いほど時間がかかる(精度も下がりやすい)というデメリットも存在する。

活用方法としては手書きの文字をコンピューターに認識させたり、顧客の購買意欲をデータから予測したりといったものが挙げられる。明確なデータに基づいた教師あり学習なので、局所的な推測に適切な方法として覚えておこう。

なお、混同されがちなK平均法(k-means clustering)はクラスタリングの手法の一つで、教師なし学習。つまり、データを前提としない。

AI用語解説:×AI編集部監修

AI用語を調べる

アイウエオ索引

アルファベット索引

AI用語事典TOPに戻る