AI用語事典
ナイーブベイズ
Naive Bayes
ナイーブベイズとは、とあるデータがどのカテゴリーに属するものなのか判定する、機械学習の手法のひとつ。単純な確率モデルを基にベイズの識別規則(次の式で定義される事後確率が最大となるクラスに観測したデータを分類するという規則)に沿って予測を行うのが特徴で、比較的単純なアルゴリズムを用いることで知られる。
簡単に言えば「X(例えば誰かから連絡が来た、仕事を休んだなど具体的な事象等)というデータが与えられた時、Y(例えばその連絡は吉報か悪報か、休んだ理由などそこから推測される事柄)が出力される確率」を見て、最も数値が大きくなるYを求める。こういった公式をベイズ分類器と言う。
ナイーブベイズはそこから更にシンプルに、もっともらしい仮説を立てることで公式を単純化する。よってナイーブベイズは「単純ベイズ分類器」と呼ばれることもある。上記の「誰かから来た連絡が良い知らせか悪い知らせか」を例にすれば「その連絡そのものではなく、そこに含まれる単語を基に良いか悪いか分類する。単語の出現確率(単語同士の関連性)については深く考えないものとする」というのがナイーブベイズである。シンプルゆえに精度の低さも指摘されている。
ナイーブベイズは機械学習を行う上で最も簡単な手法という声もあるが、その一方で「機械学習に本来確率の学習は必要ないため、その認識は間違いである」という意見も存在する。実際、シンプルゆえに理解しやすいかと言えば意外とそうではなく、公式に当てはめようとすると一気に複雑化するので、学ぶ場合は順を追って丁寧に理解していく必要があるだろう。
ただし、ナイーブベイズは迷惑メールのフィルター機能やWebニュース記事のカテゴリー分けなど身近なところで使用されることも多く、今後も様々な活用が予想される手法である。
AI用語解説:×AI編集部監修