商品名 | 画像 | 購入サイト | 特徴 | 対応OS | 登録言語数 | カスタム登録可能 | 自動文字エージェント機能 | 自動学習機能 | 声登録機能 |
---|---|---|---|---|---|---|---|---|---|
AmiVoice Ex7『医療用音声認識ソフト』 |
※各社通販サイトの 2024年8月19日時点 での税込価格 |
医療現場で使用するならこれ一択 | Windows 11(Ver7.80以降)/Windows 10,8.1,8 | - | ◯ | - | ◯ | - | |
NCHソフトウェア『Express Scribeテープ起こしソフトWindows版』 |
※各社通販サイトの 2024年8月19日時点 での税込価格 |
お手軽価格で高精度の文字起こしが可能 | Windows 11,10,8.1 | - | - | - | - | - |
音声認識ソフトとは?
音声認識ソフトとは音声を自動でテキスト化することが出来るソフトウェアで、別名「文字起こしソフト」とも言われています。マイクなどを通じてPCやスマホ、タブレットなどに音声を取り込むことにより文字として出力されます。
昔は会議の議事録などは速記や録音後に手動での文字起こしが主流でしたが、現在は音声認識ソフトの進化によりほとんどが自動で行なわれています。
音声認識ソフトはどんな使い方がある?精度は?
以前は音声認識ソフトと言っても精度がかなり悪く、一度起こした後でも大々的な修正を行なわなければいけないなどの理由から実用化までは程遠いとされていました。しかし、近年ではAI技術の発展に伴って実用的なレベルまで性能が向上し、世界的な会議の場や商談などでもどんどんと導入されています。また、さまざまな言語に対応するようになってきているため、英語を日本語で文字起こしなど問題なく行えるようになってきています。
肝心の精度ですが、音声認識ソフトと言うものが出始めた頃は50%を下回るものも珍しくなく、手動での文字起こしと労力が変わらないとまで言われていました。しかし最近では80%以上は当たり前、高いものでは95%前後の認識精度をほこるものもあり、いよいよ実用性が高くなってきています。
音声認識ソフトの選び方
それでは早速音声認識ソフトの選び方を見ていきましょう。ポイントは下記。
【1】登録語数
【2】対応OS
【3】有料版か無料版か
【4】その他機能
上記のポイントをおさえることで、よりほしい商品をみつけることができます。一つひとつ解説していきます。
登録語数で選ぶ
まずは登録語数ですが、もちろん多ければ多いほど良いとされています。たとえば日本語であってもさまざまな方言などがありますが、登録語数が少ないとこの方言がしっかり認識されず、結果として不認識となってしまったりする場合も。
用途によってさまざまですが、どんな使い方をするでも100万語以上は必要になってきます。経済用語や医療用語、IT用語などどの用語に強いかは自分の使い方に合わせて選ぶと良いでしょう。
対応のOSを確認
音声認識ソフトはWindows/Mac両方に対応しているものが意外と少ないのが現状。さらに現行製品が少し古いものもあるため、最新のWindows10/11に対応を謳っていない製品も中にはあります。現在の自分のOSに使用できるかどうかを事前にしっかりチェックしておきましょう。
また、スマホやタブレットで使用したい場合はAndroid端末に対応できるかどうかがポイントになります。こちらも合わせて確認すると良いでしょう。
価格で選ぶ!有料版か無料版か
音声認識ソフトは本格的なものはかなり月額が高かったりソフト自体が10万円を超えていたりと決してそこまでコストが安いものではありません。しかし、中には期間限定トライアルにより無料で使えたり、機能制限がついている製品もあります。長く使い続ける予定がある、頻繁に利用する可能性が高いという人はまずはトライアルで試してから導入を検討してみても良いでしょう。
辞書登録機能があると便利
後から自分自身で語句や意味を追加できる辞書登録機能が付いているものであれば使いやすくなります。時代とともに言葉は変化していき、現在は耳馴染みのない言葉であっても新たな言葉が使われ始める可能性は高いと言えるでしょう。カスタムして語句を追加することでソフトに語句を認識させやすくすることが出来ます。
自動学習機能で作業を効率的に
自動学習機能とはソフトが自動で語句を学習していく機能です。最初のうちは認識できなかった言葉も繰り返し文中に使用されることにより、どんどん認識率が上がっていきます。これにより新しい言葉や略称などもどんどん対応できるようになってくるため、結果として自分が使いやすいようになりますよ。
音声認識方法はリアルタイム型とアップロード型の二種類から選ぼう
文字起こしの方法はリアルタイム型とアップロード型の二種類が主です。
リアルタイム型はその名の通り会議中などに音声をソフトが判別し、そのまま文字に起こす方法です。文字情報の変換がその場で行える、字幕代わりに使用できる、文字起こしを後から読み返して振り返りが出来るなどのメリットがありますが、文字起こしの精度が音量や話者との距離で著しく低くなってしまうなどがデメリットとしてあげられます。
アップロード型は音声データをソフトにアップロードしてテキストに変換する方式です。精度も高く、音量を上げれば遠い話者の音声データであっても文字起こしが可能ではありますが、リアルタイムに比べて手軽さが少ないというのがデメリットといえます。
どちらも一長一短ですし、ソフトによってはどちらも対応しているものもあります。事前に確認しておくと良いでしょう。
声の登録機能は用途次第!
話者の声や話し方を登録しておくと文字の認識精度が上がり、誤字脱字が少なくなるというメリットがあります。しかし、声を登録するという手間がかなり煩雑ですし不特定多数が会話するようなシーンの文字起こしには不適切です。もちろん使い方次第にはなりますが、特定の人が会話するよりも不特定多数が会話する会議などで使用することが多いのであれば登録は不要と言えます。
Bluetooth対応モデルかもチェック
Bluetoothのヘッドセットやマイクを使用する場合、ソフトがBluetooth出力の音声に対応しているかどうかもチェックしておくと良いでしょう。有線や2.4GHzのマイクにしか対応していない場合もあります。また、使用できてもBluetoothのマイクはそこまで能力が高くないものも多いため、認識率に影響が出る場合もあります。Bluetoothのマイクを使用していて認識率が低いと感じたら有線のマイクに切り替えると改善する場合がありますよ。
有料版|音声認識ソフトのおすすめ2選
それでは前述した音声認識ソフトの選び方のポイントをふまえて、プロのIT家電ライターたろっささんと編集部が厳選したおすすめ商品をご紹介します。まずは有料版からになります。
医療現場で使用するならこれ一択
カルテやカンファレンスで使用されるような医療用語に強いソフトです。専用の辞書が登録されており、医療の現場での会議などに好適。自動学習機能もしっかり搭載されているため、長く使用できるというのもポイントです。
対応OS | Windows 11(Ver7.80以降)/Windows 10,8.1,8 |
---|---|
登録言語数 | - |
カスタム登録可能 | ◯ |
自動文字エージェント機能 | - |
自動学習機能 | ◯ |
声登録機能 | - |
対応OS | Windows 11(Ver7.80以降)/Windows 10,8.1,8 |
---|---|
登録言語数 | - |
カスタム登録可能 | ◯ |
自動文字エージェント機能 | - |
自動学習機能 | ◯ |
声登録機能 | - |
お手軽価格で高精度の文字起こしが可能
コスパに優れたソフトで、低価格で多機能なのが大きな特徴です。Microsoft Officeの主要なアプリに対応、動画からも音声入力可能、テープ起こし完了後自動で特定の相手に文書送信、CDからの音声直接読み込みなどさまざまな用途に使用できます。議事録作成から字幕起こしまで幅広く使いたい人におすすめです。
対応OS | Windows 11,10,8.1 |
---|---|
登録言語数 | - |
カスタム登録可能 | - |
自動文字エージェント機能 | - |
自動学習機能 | - |
声登録機能 | - |
対応OS | Windows 11,10,8.1 |
---|---|
登録言語数 | - |
カスタム登録可能 | - |
自動文字エージェント機能 | - |
自動学習機能 | - |
声登録機能 | - |
「音声認識ソフト」のおすすめ商品の比較一覧表
商品名 | 画像 | 購入サイト | 特徴 | 対応OS | 登録言語数 | カスタム登録可能 | 自動文字エージェント機能 | 自動学習機能 | 声登録機能 |
---|---|---|---|---|---|---|---|---|---|
AmiVoice Ex7『医療用音声認識ソフト』 |
※各社通販サイトの 2024年8月19日時点 での税込価格 |
医療現場で使用するならこれ一択 | Windows 11(Ver7.80以降)/Windows 10,8.1,8 | - | ◯ | - | ◯ | - | |
NCHソフトウェア『Express Scribeテープ起こしソフトWindows版』 |
※各社通販サイトの 2024年8月19日時点 での税込価格 |
お手軽価格で高精度の文字起こしが可能 | Windows 11,10,8.1 | - | - | - | - | - |
無料版|音声認識ソフトのおすすめ4選
それでは次に無料で使用できる音声認識ソフトのおすすめをご紹介します。
Googleドキュメント
Google社が提供している文章作成ツールで、一度は使用したことがある人も多いと思います。このGoogleドキュメントは実を言うと音声入力での文字起こしにも対応しており、「ツール」の「音声入力」を押して後は話すだけ。入力精度自体はそこまで悪くないのですが、Google Chromeでしか使用できない、発言者の区別が出来ない、音声データで残らないなどのデメリットもあるため、あくまでも補助的に使用するのが良いでしょう。
Speechnotes
主にPC、Android端末での文字起こしが可能なサービスです。論文作成やブログ作成などに適しており、Googleの音声入力エンジンを使用しているので入力精度も高いのが特徴。多数の言語にも対応しているため、多くの国の言葉に自動で翻訳も行えます。iPhone版はリリースされていないため、Apple製品をお使いの人はPCで利用しましょう。
Group Transcribe
Microsoftが提供している文字起こしサービスで、こちらはMicrosoftが提供している製品にしては珍しくiOSでしか使用できないアプリです。iPhone以外の人は使えないのがネックではあるものの、会議に参加している人それぞれが自分のiPhoneを用いてこのアプリを使用することにより、発言者の識別と書き起こし、翻訳の高精度を実現しています。とくに登録なども必要ないため、すぐに使用できるのが大きなメリットと言えるでしょう。
Rimo voice
Rimo voiceは日本語に特化した文字起こしサービスで、会議で録った音声ファイルやイベントの動画ファイルをアップロードすると文字に起こしてくれます。アップロードだけでなくその場での録音もできるため、利便性が高いのが特徴です。また、ChatGPTを利用して要約を作成し、内容の振り返りをしやすいのもポイント。60分無料で使用できるため、まずはトライアルを試してみると良いでしょう。
精度を高めるにはマイクもこだわろう!
音声認識ソフトの音声入力精度を最大限に高めるためにはマイクにもこだわる必要があります。もちろん1,000円以下のようなマイクでも使用はできるものの、ノイズや全方位性などが邪魔をしてどうしても上手く認識できないという状況が多発します。そうならないようにノイズキャンセリング機能やノイズ抑制、指向性がしっかりしているマイクを選ぶことによりそういった状況を軽減できますよ。
音声認識ソフトに関連する記事のご紹介
まとめ:音声認識ソフトを上手く活用してビジネスシーンで優位に立とう
文字起こしの作業は単純ながらもかなり根気のいる作業で、1時間の議事録を文字起こしするのに数時間かかるということも少なくありません。しかし音声認識ソフトを利用することにより、そういった時間を遥かに短縮することが可能。5分程度で作業が終わることもあります。みなさんも是非これを機会に音声認識ソフトを導入し、時間を有効活用する助けにしてみてくださいね。
◆Amazonや楽天を始めとした各種アフィリエイトプログラムに参加しており、当記事で紹介している商品を購入すると、売上の一部がマイナビおすすめナビに還元されます。◆記事公開後も情報の更新に努めていますが、最新の情報とは異なる場合があります。(更新日は記事上部に表示しています)◆記事中のコンテンツは、エキスパートの選定した商品やコメントを除き、すべて編集部の責任において制作されており、広告出稿の有無に影響を受けることはありません。◆アンケートや外部サイトから提供を受けるコメントは、一部内容を編集して掲載しています。◆「選び方」で紹介している情報は、必ずしも個々の商品の安全性・有効性を示しているわけではありません。商品を選ぶときの参考情報としてご利用ください。◆商品スペックは、メーカーや発売元のホームページ、Amazonや楽天市場などの販売店の情報を参考にしています。◆レビューで試した商品は記事作成時のもので、その後、商品のリニューアルによって仕様が変更されていたり、製造・販売が中止されている場合があります。