プログラム概要
スマートスピーカーやコールセンターなどの音声コマンドや近接発話の音声認識が実用的な精度に達している中、今後は、自然な話し言葉で、かつ離れた距離にも対応する大語彙・遠隔発話音声認識の実用化が期待されています。
リコーではその高難度な音声認識の実用化には、新たなアプローチが必要と考え、End to Endモデルやマルチモーダル学習に取り組んでいます。
本講演では、それらを用いた大語彙・遠隔発話音声認識の研究について概説します。
また、音声認識技術を活用した課題解決について、ディスカッションができればと思います。
ご参加をお待ちしております。