次世代コンタクトセンターのあり方を考える専門サイト。コンタクトセンターに関するブログ公開中。
CONTACT CENTER Wiki 音声認識
音声認識とは、人間の声などをコンピュータに認識させ、言葉を文字列に変換することや、音声の特徴をとらえて声を出している人を識別する機能のことを指しています。
コールセンターの次世代ソリューション
コールセンターにおいての音声認識は、主に顧客との通話内容をテキスト化し記録するために用いられます。コールセンターが長年抱えていた「VOC(Voice of Customer)の収集」「コンプライアンス強化」「応対履歴の入力時間短縮」といった課題に対するソリューションとして、現在注目されているシステムです。顧客に左右される部分が大きい平均通話時間(ATT/Average Talk Time)は短縮が難しいため、コミュニケーターは後処理時間(ACW/After Call Work)を短くすることで、平均処理時間(AHT/Average Handling Time)の短縮を目指します。しかし、それが原因となり、記入漏れなどヒューマンエラーにつながることがあります。音声認識システムは、こうしたリスクを軽減するのに役立ちます。また、音声認識システムは複数のコミュニケーターの発話をリアルタイムに音声認識・テキスト表示し、適切ではないやり取りがあればすぐに感知する、といったコンプライアンス強化対策としても利用されています。また、応対品質の観点からも適切なタイミングで指導・エスカレーションを行うことも可能です。長年コールセンターの課題だったVOCの収集も、音声認識システムの導入で大きく変化してきています。テキスト化された顧客の声からニーズを把握し、有益な情報として商品開発・サービス改善に活かすことができます。
信頼度を懸念する声も
音声認識をコールセンターで活用する場合、鮮明ではない電話口の顧客の音声も認識する必要がある為、その認識率に懸念する声も散見されます。また、集約された膨大なテキストから、どうやってVOCを分析するのか、という課題も残っています。それらを解決する為には、辞書メンテナンスや、自社のコールセンター環境の音声や言語データを音声認識エンジンに学習させることにより精度の高い音声認識をすることが可能になります。現在では、コミュニケーターなど良好な通話環境で、鮮明かつ丁寧な話し方をする場合の認識率は平均80~95%と言われており、顧客など鮮明でない話し方の音声は、平均50~80%程度と言われています。VOCの分析に関しては、テキストマイニング(文字列を対象としたデータマイニング)で、ワードや話題の出現頻度や、出現傾向、時系列などを分析し、有益な情報を抽出することができます。