連載:AI脳の創り方
Vol.12
ビジネスパーソンのための戦略的AI活用のキモ
19Sep

私が業務として携わる技術研究・開発の一環として、コンタクトセンターにおけるVOC(Voice of Customer:顧客の声)の分析プロセスにAI導入を図るという課題があります。
コンタクトセンターはご存知のように「企業が提供する製品やサービスについて顧客からの問合せや質問を受け付けて対応を図る」重要部門であり、それを電話のみで行っていた時代にはコールセンターとも称されていました。
コンタクトセンターに集まるVOCは企業が顧客を理解し、適切なマーケティングに生かしていくための重要なデータのひとつとして、昔から分析の対象とされています。しかし、分析対象となるVOCを集めるためには音声記録から通話内容を書き起こすか、オペレーターに通話内容を履歴として残してもらうくらいしか手段がありませんでした。
お客様の声を一つ残らず分析することでこれまでにないサービスや商品への要望や困りごと、改善のためのヒントが得られるかもしれないという期待はありました。しかし、現実的にそこまでしてVOCをデータ化して残すことは難しかったのです。
AIで音声認識の精度は格段に向上したものの…
ところで、AIスピーカーを使ってみたことはあるでしょうか。ちょっとした気恥ずかしさを克服して「オーケー、○○、教えて」などと名前を呼びながら話しかけるだけで、音声でその日の天気や時間を教えてくれたり、ちょっとしたメモを残しておけたりとなかなか便利なものです。こうした便利さを実現しているコア技術は「音声認識技術」です。AIの進歩の恩恵は音声認識技術にももたらされており、私たちの自然な発話を正確にテキストに変換できる精度が実現できるようになったことでAIスピーカーのような製品が実現できています。
そんな高い精度で発話をテキスト化できる音声認識技術があるのであれば、お客様とオペレーターの会話を音声認識でそのままテキストデータとして変換しながら記録していくだけで、余計な手間をかけることなくVOCデータを続々と集めることができそうです。実際にいくつかの大手企業のコールセンターではいち早く音声認識技術を導入して、通話履歴のテキスト化に取り組んでいるところがあります。
そうして集められたVOCはもちろん収集されるだけでなく、分析して顧客理解に繋げることや様々なサービス改善に活かすことを目的にテキストマイニングツールなどを使って分析が試みられることになります。ご存知の方も多いかと思いますが、テキストマイニングツールは複数のテキストで特徴的に表れるキーワードや特定のキーワードに関連する語句などを分析することができます。同じ日本語のテキストデータなのですから音声認識をしたデータも同じように分析ができるはずだと考えがちです。が、実は音声認識によって得られたVOCデータをテキストマイニングツールで分析してもなかなか望むような結果は得られません。
実は、現状の音声認識はまだまだ未熟
最新の音声認識技術では(しっかりとチューニングをすれば)95%の精度で正しく認識が可能になっているそうです。95%の認識精度というのは実は人間が音声を聞いてテキスト化するのと同じかやや上回るほどの精度です。しかし、これは比較的キレイに録音された音声を使った場合の精度でしかありません。
実際の通話履歴を聞いてみるとわかりますが、発話がかぶって途中で途切れることや、言い直しをしたり、途中で外部の雑音が入ったりと人間が聞いても聞き取りが難しいようなものが多数あります。人間は、そうした音声であっても前後の文脈などから上手く内容を類推しながら会話を続けることができます。ですが、現在の音声認識技術ではそういった音声を上手くテキスト化することができないのです。これが、VOC分析におけるAI導入のひとつの壁となっています。もうひとつの障壁要素があるのですが、それは次回に詳しくお話しましょう。
AI脳の創り方「ビジネスパーソンのための戦略的AI活用のキモ」
前の記事 Vol.11 AIが完璧でないことを甘くみることで被る代償とは
次の記事 Vol.13 「AIでVOC分析」を実現するうえで解決すべき課題
PROFILE

株式会社 TMJ 営業統括本部 マーケティング推進本部 サービス推進部 Data Science推進室
小泉 敬寛(こいずみ たかひろ)
2008年より京都大学 工学研究科 助教としてウェアラブルメディア、コミュニケーションに関する研究を行う。2016年より株式会社TMJに入社。現職では統計処理や機械学習などの新技術に関する調査、研究・開発を担当。AIをはじめとする新規技術を使ったサービスやソリューションの提案やコンサルティングに取り組んでいる。