2018.07.05テープ起こしと音声認識

意外と知らない事実?音声認識のポイントは「マイク」です!

Pocket

意外と知らない事実?音声認識のポイントは「マイク」です!

働き方改革が待ったなしの今、AIによる文字起こし業務の効率化が注目を集めています。でも、ちょっと待ってください。いくら技術が進歩したからといって、「マイクを使わずに録音したデータは、音声認識技術を活用するには意外と使いものにならない」ことをご存知でしょうか?手軽に音声が録音できるので重宝するICレコーダーも然り、少しショックかもしれませんが、これが意外と知られていない事実です。
では、どうすれば音声データを「良質な素材」にすることができるのでしょうか?
今回は、音声を有効的に活用するために、マイクの重要性についてお伝えします。

「使える音声データ」はマイクで作る

A Iのおかげで、音声認識の技術も日進月歩。VoXT をはじめとするアドバンスト・メディアのサービスに対する引き合いも増えています。そんな中、お問い合わせで断トツに多いのが、「ICレコーダーで会議を録音しているのですが、使えますか?」というものです。

答えは、残念ながら「使えません」。ICレコーダーがダメなのではなく、マイクを使わず録音した音声データでは正確に文字にするのが難しいのです。なぜなら、複数の人の音声が入り交じったり、発言者が遠くから喋っている場合、音声認識が難しいからです。そういった状況の音声データでは、いくら音声認識技術の精度が上がっていても、自動でうまく文字を起こすことはできないのが現状です。

音声認識技術の活用で一番肝心なのは、「クリアに音声を収録すること」。そこでポイントになるのが、マイクの利用です。マイクを利用することで、AIが発言者の声をより明瞭に認識できるようになるからです。
つまり、「マイクを使った音声データ」=「AIが使いやすい素材」と言えるでしょう。

美味しい料理を作るには、良質な素材選びがポイントですが、自動の文字起こしにも同じことが言えるのです。これは、書くことが生業であるプロのライターでも意外と知らない盲点だったりします。

「発言者1人に対して1マイク」が理想

音声認識技術を活用するのに「良質な素材」を手に入れるには、マイクが不可欠であることはお分かりいただけたと思います。ただ、マイクにもいろいろな種類があり、「よりよい素材」を作るためには、いくつか押さえておくべきポイントがあります。

その一つが、発言者1人ひとりにマイクを準備することです。特に、複数人が参加する会議や勉強会などの場合は重要となります。発言者を区別しながら発言者の声をできるだけ明瞭に録音する必要があるためです。これが、高い精度の音声認識に直結します。

人間の耳で聞き取れないものは、AIでも聞き取れない。これが基本と考えてください。もちろんマイクの種類、参加人数、空間の広さにもよりますが、発言者とマイクが近くなれば、音声データの認識精度も当然上がります。
マイクの品質がよっぽど粗悪なものでない限り、マイクから発言者が近いほど、「良質な素材」が手に入る。これも大切なポイントです。

おわりに

「会議中にリアルタイムで文字起こしがしたい」、「セミナーや講演会の記録をテキスト化して活用したい」、「セミナー等を字幕付きでインターネット上に配信したい」、「録音した音声のテキスト化データ化の作業が大変」、「インタビュー等のコンテンツ作成をスピーディーに行いたい」。こんなお悩みがあれば、まずは、VoXTの「お試し機能」をご利用ください。音声からテキストを起こす作業を伴うものであれば、どのような業務にも対応できます。

  • このエントリーをはてなブックマークに追加
The following two tabs change content below.
編集部
このブログの編集部です。 音声文字起こしに関する最新情報などを発信していきます。