文字起こしと音声認識 , 文字起こしの活用 , 文字起こしの道具

音声認識の精度を上げる!意外と知らないマイクの「指向性」とは?

Pocket

近年、音声認識は少しずつ日常生活の一部になりつつあります。
手を動かさずに“声”で文字起こしを可能にする一方、

思ったような認識精度が出ないことはありませんか?

今回は、音声認識の精度を上げるために大切なマイクの「指向性」についてご紹介します

そもそも指向性とは?

平たく言うと「音をよく拾う向き」のことで、
どの角度、どの向きから話せば、マイクが音をよく拾えるのかを示しています。
指向性には大きく分けて“無指向性(全指向性)”、“双指向性”、“単一指向性”の3種類があります。

・無指向性(全指向性)
周囲の全ての音を、まんべんなく同じ感度で拾います。雑音が入りやすいため、音声認識には適しません。

・双指向性
マイクの前方と後方、2種類の音を拾います。無指向性マイクよりも雑音を拾いにくく、対談のように向かい合って話す場合の録音に適しています。

・単一指向性
特定の方向の音だけを拾います。マイクの正面の音だけに反応し、雑音を拾いにくいためクリアな録音が可能です。

指向性マイクで音声認識の精度が上がる

音声認識の精度は、録音する音の質によって大きく左右されます。

そのため、無指向性のICレコーダーやPCの内蔵マイクよりも、“指向性のある”マイクを利用することを強くおすすめします。

対談の場合は双指向性マイク、講演やセミナーでは単一指向性マイク、というように用途・利用シーンによって適切な指向性マイクを使い分けることも重要です。

ただし、指向性があるマイクを使いさえすれば良いという訳ではありません。
指向性のあるマイクが一番効果を発揮するためには、正しい指向性の向きで利用することが重要になります。指向性の方向に向かって発話をすることで、より高い認識精度を得ることができます。逆に、指向性とは別の向きから発話すると、認識精度は下がってしまいます。

今日からできる!認識精度を上げる録音方法

ここまで指向性マイクを利用して音声認識精度を上げる方法をご紹介しましたが、
お手元に指向性マイクがないという方もいらっしゃると思います。
そんな方向けに、今日から手軽に始められる認識精度を上げる方法をご紹介します。

・正しい距離で利用する

マイクと口元はどれくらいの距離で使用することが適切なのかご存知ですか?
マイクの種類によって推奨の距離は異なりますが、マイクと口元の距離は1m以内で使うのがお勧めです。
会議室の大きなテーブルの真ん中にマイクをポツンと1つ置く、というような使い方をしているとなかなか音を上手く拾えません。マイクの設置距離を少し変えるだけでも、認識精度はグッと上がります。

・雑音の少ない場所で録音する

録音時は雑音が多い環境を避けて静かな場所で行ってください。雑音を減らすことで認識精度をより高めることが可能です。例えば、周囲の話し声や部屋の空調設備の音、会議中のキーボードのタイプ音や紙をめくる音など、雑音となりうる要因は沢山あります。全てをきれいに取り除くことは難しいですが、少し気を付けるだけで認識精度はぐっと上がります。

ちなみに以下の記事では、録音環境によって認識精度を上げる方法を詳しくご紹介しています。ぜひこちらも参考にしてみてください。

・録音環境でこんなに変わる! 文字起こしの精度を高める3つのコツとは

https://voxt.jp/magazine/tool/recorder

まとめ

いかがでしたか。音声認識の精度に関わるマイクの“指向性”について、詳しくご紹介しました。

インタビューのレイアウト

マイクの種類や録音方法を工夫するだけで、認識精度は大きく向上します。
ポイントを抑えることで、ぐっと音声認識が利用しやすくなりますので、ぜひ試してください。

  • このエントリーをはてなブックマークに追加