AI導入に必要な学習データの量とは

AI開発に必要な学習データ量の捉え方を解説

menu

×AI

連載:Q&AI

Vol.6

AIベンチャー社長がズバリ指南。失敗しないAI活用の勘どころ

AIを導入するには多くのデータが必要だと聞きました。本当のところはどうなのでしょうか?

AIを導入するには多くのデータが必要だと聞きました。本当のところはどうなのでしょうか?

AIベンチャー社長の中村氏が、AIビジネスを検討するビジネスパーソンの疑問や質問に回答するQ&A企画。今回は、AI導入を検討している企業の担当者から寄せられた声にズバリ回答いたします。

Q:データ量があまりないとAIを導入できないのか

「AI導入には多くの学習データが必要だと聞きました。データ量があまり集まっていない状態なのですが、導入は難しいでしょうか?」

A:システム導入の根本的な考え方を理解することで、データ量への捉え方が変わる

AI導入と聞くと、一般的にディープラーニングを想像されますよね。賢いアルゴリズムへとにかく膨大な量のデータを入れて、学習をさせれば希望通りのものが完成する、というイメージ。
実際に画像認識や音声解析などは、膨大なデータ量が必要で、猫の画像を100万枚くらい入れて機械学習させ、猫だと判別できるようにしていきます。
こういった画像認識や音声解析などは、膨大なデータを使って進める場合のアプローチ。
ただ企業のニーズとして、猫を認識したいといったケースは、まずありませんよね。
では、万引きを認識したいという目的の場合、万引きのデータ100万件……、これも現実的に非常に難しいものです。

それに大量の学習データがあったとしても、すぐに使える訳ではありません。明確な利用目的がないと、結局意味のないデータになってしまう、そういったケースは非常に多いのです。
つまり、AI化や自動化を進める場合、データを入れてしまえば、全てを判断できるようになるという訳ではないのが現実なのです。

では実際にAIを導入する際、どんなデータが必要になるのか。必要になるのは大きく次の2種類のデータです。

1. ルールを作るためのデータ
代替効果という大枠を作ります。ナレッジを統合していくときに、精度が上がらないというような場合があります。Q&Aサイトの例ですと、「紛失」という言葉、人によっては「失くした」と表現する人もいます。こういった表現の違いについては、事前に想定で……というのは非常に難しく、実際のデータを確認しながら大枠を作っていく必要があります。
また社員の声やマニュアル、メールの履歴などのデータからルールを作っていきます。ただ、社内にAI人材がいない場合は、腕の良いコンサルがいる業者へ依頼をし、様々なデータをもとにルールを作ってもらう必要があります。そうしなければ、アルゴリズムへデータを入れてしまうだけになってしまい、目的を実現するのが難しくなってしまいます。

2. チューニングをするためのデータ
データが現実的に法人のニーズとして、役立つレベルで整備されているケースは非常に稀で、あるにしても報告だったり、雑なナレッジの状況であったりします。こういったデータは、細かいチューニングといった形で活用していきます。ただ、こちらも業者にて調整をしてもらうなどの対応が不可欠。

その後、システム化をして運用していくことでデータがたまり始め、そのデータをもとにアプローチができるようになり、より望んだ成果が得やすい環境となります。

つまりは最初から完璧なものを求めるというよりも、運用しながらデータを蓄積していき、蓄積したデータを利用しながら育てるというのが前提。導入を検討するといったら必ずしも膨大な量のデータを用意しなければならない、ということはないのです。

ただ、学習型のものを利用したいと考える場合、最初は赤ん坊みたいなものです。そう言われると「システム化をしてから2年くらいは大変」と思われてしまう方も多いのですが、我々のところでは、最初の赤ん坊のような段階では、納品せずに18歳くらいの状態で出荷するようにしています。そういったところを選んで依頼すれば、導入後の工数に手間がかかるということはありません。

サービスを導入したからといって、すぐに100%うまくいくというのは、どのようなものにも無く、結局サービス導入も新規にオペレーションを改革していくということなので、失敗確率0%でないとやらないという場合ですと、新規施策はできなくなってしまいます。
ITやAIに限らず、これから様々なBtoBのソリューションがたくさん出てくると思いますが、いざ何かをはじめるときに「実績はどうだ」「前例はどうだ」といったら、導入はできなくなるということですね。
これまでの意志決定のように、システム導入に数億という意思決定はあまり現実的ではなく、とりあえずやってみて、ダメだったら閉鎖するようなアジャイルな意思決定が非常に重要になってくる、むしろそういった考え方になっていないといけないのではないかと思います。

PROFILE

中村陽二

株式会社サイシード

中村陽二(なかむらようじ)

東京大学工学部、同大学院工学系研究科修了。マッキンゼー・アンド・カンパニーでM&A、成長戦略の構築に携わった後、株式会社サイシード創業。100社以上の業務効率化、ツール導入に携わった実績を持つ。HP:https://www.sciseed.jp/

関連記事