音声認識AI技術がもたらす業務改革の未来とは

公開:2019年05月09日

昨今、ITトレンドの中で「音声認識AI(人工知能)技術」はとくに大きな注目を集めています。AIアシスタント機能を持つ「AIスピーカー」は人が話す自然な言語に対応しており、「今日の天気は?」などと話しかけると、スピーカーがあたかも人間のように答える...このようなシーンを見かけることが多くなってきました。

では、日常シーン以外でも、音声認識AI技術が役立つことはあるのでしょうか。今回は、AI音声認識の仕組みとあわせて、業務改革にどのように影響するのかを見ていきたいと思います。

音声認識の基本的な仕組みについて

音声認識とは、私たち人間が発した「言葉」を「文字」に変換するまでの過程を指します。音声認識の革新的なところは、私たちの声をただの「音」として認識するのではなく、前後の文脈をしっかりと認識しテキスト化することができるという点です。
発音方法や音域は人によって異なるので、様々な人の音声を聞き取り、それをテキスト化するのは想像以上に難しい技術と言えます。そこでまずは、音声認識の基本的な仕組みについてご紹介します。

私たち人間から発せられた「音声」は「音声波形」という図として表現できます。この音の波から、コンピュータが音の最小単位「音素(おんそ)」を特定し、テキスト化するのが音声認識技術です。

コンピュータは膨大な音声サンプルデータを記録し、保存しておくことができます。入力された音声は、記録された音声サンプルデータをもとに言語の情報へ変換されるため、結果としてその入力された音声が“ピアノの音色”でもなければ“車のクラクション”でもなく、“人の声”であると認識することができます。

今やこのような技術はスマートフォンやタブレットにも搭載されています。例えばiPhoneのSiriやアンドロイド端末の音声アシスト機能などのように、簡単な操作を声だけで行えたり、必要な情報を音声で教えてくれたりする機能は、音声認識にAI(人工知能)をプラスしたものなのです。

音声認識+AIを活用した業務改善事例

私たちの生活に、音声認識は大きな変革をもたらしました。音声認識にAI(人工知能)をプラスした技術は、さまざまな企業で業務改善を行うためにも、大いに活用されています。以下では、音声認識AI技術が業務改善にどのように利用されているかを、具体的な例を挙げてご紹介します。

コールセンターのフィードバック効率が向上

お客様からのお問い合わせ電話に対し、内容に応じてベストな応対をするのがコールセンターの仕事です。コールセンターでは、お客様への対応が適切かどうか調べるため、定期的にサンプリング調査を行い、オペレーターの通話対応を評価することがあります。その後、オペレーターに対しフィードバックが行われ、応対品質の向上に活用されています。
しかし、このサンプリング調査の評価は人が行うため、判断が個人の“感覚”に左右されることが少なくなく、また集められるサンプルにも限りがあるために「正確な統計が出せない」という問題がありました。

そこで導入されたのが、コールセンターでのやり取りを録音し、音声認識AI技術を用いてテキスト化する方法です。テキスト化した文章から、「あいさつに問題はないか」「NGワードが含まれていないか」などを抽出すれば、公平かつ正確に評価を行うことができます。
オペレーターにとっては、自分の応対をテキストで確認できるほか、正確なフィードバックを確認できるので、スキルアップに役立てることができるというメリットもあるのです。

音声認識AI技術を商品の仕分けに導入

音声認識AI技術は、物流センターにおける「仕分け」にも活用されています。ある洋菓子メーカーでは、工場から店舗への商品配送を効率的に行うために、音声認識AI技術を導入しました。

これまでは、端末を手に持ちタッチパネルを操作して「どの商品を」「いくつ」「どの店舗に」仕分けるのかを確認し、実際に店舗ごとのラックに該当商品のケースを置いていました。しかし現在では、どの店舗ラックに、どの商品ケースを、いくつ仕分けすべきか、を合成音声が指示してくれる上、ケースを置いたラックに割当てられたコードを作業者が発話すると、システムが聞き取って「作業完了」のステータスにすることができるのです。

声だけで仕分けができるようになったことで両手が自由になっただけでなく、端末の操作から開放されたことで、1時間あたりの作業効率を20%も上げることに成功しました。さらに、仕分けなどのミスをしてしまう確率は84%も減ったことで、結果として効率的かつ高い精度の作業を実現できるようになりました。

現状の音声認識技術の課題

業務効率に大きく貢献している音声認識技術ですが、現時点ではまだ課題もあります。例えば、現在の音声認識技術では複数人が同時に発言した場合、特定の人の発言を識別することが困難です。そのため、複数の人が発言するディベートなどで、議事録を作成することはまだ難しいと言えます。

また、音声認識技術は標準語が基盤となっているため、方言で発話した場合、正しく認識されない可能性もあります。家族や友達と「おしゃべり」するように、くだけた口調で話しかけても、うまく認識してもらえないことも起こりうるのです。更に、長い文脈を読み取ることや、人間が言おうとしている内容を「先読み」ができるようになるためには、人間の発話データを今まで以上に蓄積し、コンピュータの処理能力自体も上げていく必要があります。こうした精度面での改善も、音声認識技術の課題と言えるでしょう。

まとめ

AI音声認識機能は、今や日常シーンだけでなく企業の業務改善にも活用されています。人間と「おしゃべり」ができるようになるまでには、まだ技術改善の余地がありますが、将来的にはAI音声認識を用いた「無人店舗」や「無人カスタマーセンター」などが登場してくるかもしれません。

実際、接客から注文までを一貫して行える「AIセルフレジ」や、スマートフォンのアプリでチェックインし、決済もモバイルで行えるレジいらずの「無人店舗」が実証実験の段階まで進んでいます。こうした音声認識AI技術を用いた「無人レジ」や「無人店舗」は、人手不足が叫ばれる昨今、より重宝されていくことが予想されるでしょう。
音声認識AI技術は、時代のニーズに応えるキーワードとして注目し続ける必要がありそうです。

音声認識AI技術は、介護の現場でも活用されている

音声認識AI技術は、「時短」や「効率化」という面で大きな役割を担っています。そんな音声認識AI技術は、介護の現場でも活用されていることをご存知でしょうか。
ケア記録や請求業務のICT化を実現する福祉業務支援ソフト「ほのぼのNEXT」には、キーボードの代わりに音声でケア記録等を入力できる、音声入力支援システム「Voice fun(ボイスファン)」サービスがあります。

音声で文章入力ができることはもちろん、介護業界用に特化されているため専門性の高い用語も標準搭載している点も強みです。さらに、使用する人の声の質やイントネーションを学習し、読み取り精度を上げる学習機能も搭載しております。
実際に、キーボード入力から音声入力にしたことで、事務作業を70%近く効率化できたという結果も出ております。ケア記録作成時間の短縮だけでなく、システムへの苦手意識も軽減できるサービスです。

詳しくは、弊社担当者までお気軽にお問い合わせください。

福祉業務支援ソフト「 ほのぼのシリーズ」を見る

「ITトレンド」の最新記事

このカテゴリの記事一覧を見る

メールマガジン登録

上記コラムのようなお役立ち情報を定期的に
メルマガで配信しています。
コラム(メルマガ)の
定期購読をご希望の方はこちら

メールマガジン登録 お客様の課題解決に導く情報をいち早くお届けします! メールマガジン登録 お客様の課題解決に導く情報をいち早くお届けします!