クラスタリングとは・AI関連用語集

クラスタリングとは、意味や概念を詳しく解説

menu

×AI

AI用語事典

クラスタリング

clustering

クラスタリングとは、多くのデータから類似性を見て自動的に分類する、一般的には機械学習の教師なし学習における手法のこと。いくつかのコンピュータを連動させることにより、1台のコンピュータとして利用できるようにする技術を言うこともある。クラスター解析とも言われ、データの分類を階層的になす「階層クラスタリング」と、特定のクラスタ数で分類する「非階層クラスタリング」がある。

クラスタリング・階層クラスタリング
ひとつの大きな集合体の中で、最も類似性の高い組み合わせのものから順にまとめていく手法。あらかじめクラスタの数を決めておく必要がないのがメリットだが、必要な計算が増えると処理がしにくくなるため、ビッグデータをはじめとした膨大なデータのクラスタリングには向いていない。

・非階層クラスタリング
異なる性質のものが集まったデータから、類似性の高いものを探してクラスターを作成する手法。階層的な構造がないので膨大なデータでも処理が可能なのがメリットで、ビッグデータのクラスタリングにも適している。その反面、クラスタの数をあらかじめ決めておく必要があるのが注意点である。

このように、対象の少ないデータなら階層クラスタリング、昨今重要視されているビッグデータなら非階層クラスタリングと知っておくと良いだろう。代表的な非階層クラスタリングとしては「K-means法」が挙げられる。アルゴリズムの中では比較的シンプルな構造のため扱いやすいのが特徴なので、ビッグデータを扱う際にはまず覚えておきたい。

AI用語解説:×AI編集部監修

AI用語を調べる

アイウエオ索引

アルファベット索引

AI用語事典TOPに戻る