形態素解析エンジンとは・AI関連用語集

形態素解析エンジンとは、意味や概念を詳しく解説

menu

×AI

AI用語事典

形態素解析エンジン

Morphological analysis engine

形態素解析エンジンは、自然言語処理の一種である「形態素解析」を簡単に行えるソフトウェアのこと。形態素解析とは文章を形態素(文章を構築する最小単位)まで分割し、コンピューターに言語を分析させやすくする作業である。

言語というものは「文章が間違っていても単語の並べ方によっては通じる」「様々な言い換えができる」など自由度の高い部分も多く、人間にとっては助かるところもある。だが、コンピューターにとっては逆に曖昧であるがゆえに扱いが難しい。とりわけ日本語は単語数が膨大な上に平仮名、片仮名、漢字などの使い分けがあり、品詞や活用法も複雑なので形態素解析が非常に困難だと言われている。

とはいえ、検索エンジンの活用等には形態素解析が必要不可欠だ。そこで活躍してくれるのが、以下のような形態素解析エンジンなのである。

・JUMAN
京都大学の黒橋・河原研究室で開発されている形態素解析エンジン。何とダウンロードしなくともブラウザ上で簡単に試すことができるのが特徴で、文章を入れるだけで即座に品詞まで解析してくれる。

・MeCab
オープンソース型の形態素解析エンジン。京都大学情報学研究科、日本電信電話株式会社コミュニケーション科学基礎研究所の共同研究ユニットプロジェクトを通じて開発されたもので、Googleの日本語入力開発者でもある工藤拓が中心人物として知られている。解析速度の高さが特徴で、大規模な日本語のN-gramデータを作成する際にも使用された。

・cabocha
教師あり学習を用いるパターン認識モデルのひとつである「SVM」に基づく係り受け解析器。係り受けとは日本語における修飾関係のことで、コンピューターにとっては理解しにくい部分だが、こちらは形態素解析済みのデータや部分的な係り関係が付与されたデータでも解析が可能となっている。

この他にも様々な形態素解析エンジンが登場しており、現時点では日本語でもほぼ100%の精度を誇る形態素解析ができるようになっている。

AI用語解説:×AI編集部監修

AI用語を調べる

アイウエオ索引

アルファベット索引

AI用語事典TOPに戻る