文字起こしと音声認識 , 文字起こしの道具

録音環境でこんなに変わる! 文字起こしの精度を高める3つのコツとは

Pocket

会議の議事録を取る際に、音声認識ソフトを使用するケースは多くあると思います。その際、録音環境によって認識精度が大きく異なることをご存知でしょうか?
今回は、文字起こしの精度を高めるために録音環境で重視すべきポイントをご紹介します!

■文字起こしの精度は、録音環境によってこんなに違う!

ニューノーマル時代を迎え、私たちの生活様式はガラッと変わってしまいました。テレワークが定着し、オンラインとリアルを組み合わせて会議をするのはもちろんのこと、場合によっては参加者全員がオンラインというケースも決して珍しくありません。
その際に必須なのが議事録。作成に音声認識ソフトを使用することも多いかと思いますが、実は録音環境によって、文字起こしの精度が大きく変わることをご存知でしょうか?

実験として、「AmiVoice ScribeAssist」を用い、録音環境を変えて文字起こしをしてみました。「録音さえされていれば、同じソフトなら結果は変わらないのでは……」と思われる方もいらっしゃると思いますが、実は環境の良し悪しによって文字起こしの精度はこんなにも変化します。

(録音環境が良い場合)

(録音環境が悪い場合)

いかがでしょうか。
同じ音声認識ソフトを使用していても、環境によってその精度には大きな変化が生じます。
文字起こしの精度が悪かった場合、結局人の手で文字起こしをするのと変わらないくらいに編集の手間が発生してしまう場合もあります。場合によっては、音声を聞き直してイチから手で打ち直す……なんてことも。せっかくソフトを使っても、これでは意味がありませんね。
どのような点を録音時に気をつければ、より精度高く認識し、文字起こしをすることができるのでしょうか。

 

■文字起こしの精度を上げる、大切な3つのポイント

どのような点に気をつけて録音をすればいいのか。ポイントを挙げてみました。

①雑音が入らないよう気を付ける

雑音が入ってしまう環境では録音の品質が低下し、結果的に文字起こしの精度も落ちてしまいます。「何を当たり前のことを……」と感じている方も多いかと思いますが、自宅等でテレワークをしていると予期せぬ雑音が入ることもありますから、注意が必要です。

ポイントは、なるべく静かな環境で録音すること。オンラインの場合、話している人以外はミュートしておくと雑音が入るのを防ぐことができます。また話者は、マスクがこすれる音、呼吸音などにも注意をすると、よりクリアに録音することができます。

②他の人が話しているときに、発言がかぶらないようにする

議論が白熱すると、相手の意見にかぶせるように発言しがちです。しかし2人以上の声が混ざってしまうと、録音しても文章と認識されず精度が下がってしまうもの。会議の際は、できる限り個別に発言するよう心がけましょう。

③マイクと口元の距離を近づける

意外かもしれませんが、マイクが口元から離れるほど認識精度は下がっていきます。できればマイクと口元の距離は、1m以内にするのが理想。
またパソコンの内蔵マイクやICレコーダーだと周囲全体の音を集音してしまうため、音声認識には不向き。専用のマイクを使用することをオススメします。

どのようなマイクが向いているかは、状況によって異なります。
少人数のWeb会議で使用する場合は、ヘッドセットマイクや小型のバウンダリーマイクなどが有効。またリアルとオンライン、つまり対面会議とWeb会議を同時に行う場合は、対面の場合は集音マイクを使い、Web会議参加者はヘッドセットマイクなどを使用するのがオススメです。

ちなみに以下の記事では、会議にオススメのマイクも詳しくご紹介しています。ぜひこちらも参考にしてみてください。

音声認識で文字起こし!シーンに合わせたマイクの使い方とは?
https://voxt.jp/magazine/basic/microphone

■おわりに

音声認識ソフトを使った場合の録音環境について考えてきました。どんなに性能の良い音声認識ソフトを使っても、文字起こしの精度が低くなってしまってはもったいないものです。録音環境を工夫することで、より精度の高い文字起こしを実現していきましょう。

  • このエントリーをはてなブックマークに追加