k平均法(K-mean法)とは・AI関連用語集

k平均法(K-mean法)とは、意味や概念を詳しく解説

menu

×AI

AI用語事典

k平均法(K-mean法)

k-means clustering

K-mean法は、クラスタリング(大量のデータから類似のものを集めて分類する手法)を行うためのアルゴリズムとしてよく活用される。中でも階層的な構造を持たず、数の塊によってサンプルを分割するのが特徴の「非階層クラスター分析」に該当し、サンプル数が膨大にあるビッグデータを分析する際に最適である。

K-mean法の代表的な流れとしては、以下の通りである。

② それぞれのサンプルに対し、クラスタ(同じようなデータの集合体)をランダムに割り振る(これが初期値となる)
③ クラスタごとに重心点(座標の平均値)を計算し、サンプルが自分から一番近い重心点と同じ色になるよう塗り分ける
④ 新しい分類の中で再び重心点を計算し、その位置に応じてもう一度色を塗り替える
⑤ 色分けに変化がなくなるまで上記の流れを繰り返す

このように、K-mean法は言葉で説明すると複雑なようだが、アルゴリズムの中では比較的単純な構造をしている。

ただし、注意点もある。結果は最初のクラスタの位置が大きく影響することが多いと言われているため、1度K-mean法を試したからといって必ずしも正確な結論が得られるわけではないのだ。それゆえに最初の位置を変えながら何度かK-mean法を繰り返してより正しい結果を得る手法や、そもそもの位置を工夫するという手法が必要となってくるだろう。

とはいえ、K-mean法は非階層クラスター分析の代表格と言えるほど知名度が高く、シンプルながら処理が難しいとされるビッグデータを有益に扱える可能性がある方法なので、解決法に困った時にはまず試すべきアルゴリズムとして覚えておきたい。

AI用語解説:×AI編集部監修

AI用語を調べる

アイウエオ索引

アルファベット索引

AI用語事典TOPに戻る