FAQ

音声認識に関して録音品質により音声認識の精度が変わるようですが、良い品質というのはどのようなものですか?

録音マイクと発話者の口との距離が約5センチ程度で、周囲のノイズがほとんど無い状態であれば、音声認識システムで高精度な文字変換が可能となります。

音声認識システムは、非常にデリケートであるため、人が聞き取りやすくても、ICレコーダーを会議室のテーブルの上に置いて、マイクと発話者が遠い状態や、講演発表などの演者の声が会場スピーカーで流れるのを録音するなどでは、残念ながらほとんど文字変換ができません。また、複数の人が同時に喋り音声がかぶってしまっている場合なども、音声認識システムで文字化することは困難になります。

ICレコーダー搭載のマイクを利用される場合でも、なるべく録音マイクと発言者の距離は接近した形で録音されることをお勧めいたします。また、電話の音声に関しては本サービスは文字変換は行えません。

詳細はこちら

音声認識に関してカテゴリーの他のご質問