Word2Vecとは・AI関連用語集

Word2Vecとは、意味や概念を詳しく解説

menu

×AI

AI用語事典

Word2Vec

ワードツーベック

Word2Vecは、テキスト処理を行うためのニューラルネットワークのこと。膨大なテキストデータを解析し、単語の意味をベクトル化することでその意味の類似性を計算したり、単語同士の意味を足し引きしたりできるようになる。TensorFlowをはじめとしたソフトウェアライブラリで気軽に試すことが可能なのも特徴である。

■Word2Vecの仕組み
Word2Vecの仕組みを簡潔に説明すると、例えば「りんご、みかん、果物、ジュース」といった単語をベクトル化したとする。すると、数値としては以下のような結果になった。(今回はより簡単な数字として表現する)

・りんご:8
・みかん:6
・果物:7
・ジュース:3

つまり、ベクトル化によって「りんご」という単語に最も近いのは「果物」であり、「みかん」にもそれなりの類似性がある、ということが考察できるようになるわけだ。Word2Vecには大きく分けて単語周辺の文脈から中心となる単語を推測するCBOWと、逆に中心となる単語から文脈を構成するのに重要な要素を推測するSkip-gramという2種類のアーキテクチャ(論理的構造)が存在し、目的に応じて使い分けられる。

Word2vecは2層から成るゆえにディープラーニングとは言えないが、テキストをディープニューラルネットワークに対応可能にする機能があるため、ディープラーニングの入力値として扱われることも多い。非常に高度なテキスト処理が可能なWord2vecは、機械翻訳や顧客データに基づいたレコメンド、質疑応答システムであるチャットボットなど様々な分野での活用が期待されている。

AI用語解説:×AI編集部監修

AI用語を調べる

アイウエオ索引

アルファベット索引

AI用語事典TOPに戻る