概要
専門家の評価
長所
- ファイルから音声を書き起こすことができます
- GmailとHotmailで動作します
短所
- 試用版はありません
- モバイルコンパニオンアプリは必ずしも信頼できるわけではない
私たちの評決
コンピューターに音声入力することが魅力的なアイデアだと思われる場合は、Dragon NaturallySpeaking Premium をお試しください。これは Windows の事実上の標準です。
1964年にジーン・ロッデンベリーが初めて『スタートレック』を思いついた時、宇宙船のコンピューターに自然な音声を理解させるのは当然の選択でした。そもそも、このシリーズは遠い未来を描いていたのですから。テレポートはまだ実現していませんが、音声認識は間もなく実現します。現在バージョン12(200ドル、購入のみ)のDragon NaturallySpeakingは、このカテゴリーのベテラン製品の一つです。価格は高めですが、Windows向けの最高の音声テキスト変換プログラムであることに変わりはありません。
200ドルは、特に試用版のないプログラムとしては、かなりの金額です。さらに、音声認識を効果的に活用するには、ソフトウェアだけでは不十分です。適切なマイク、独り言を気にしない静かな環境、そしてキーボードでテキストを入力する時とは違う心構えが必要です。幸いなことに、音声認識に興味があり試してみたいというだけなら、おそらくシステムに組み込まれているはずです。Windows Vista以降、すべてのバージョンのWindowsに音声認識機能が搭載されています。これはまた、Dragonが厳しい競争に直面していることを意味します。試用版なしで200ドルのDragonと、既にコンピュータにインストールされている無料のDragonの差です。
両者を比較するために、Wikipediaの「不思議の国のアリス」の項目から一段落を選び、両方の製品で音声入力してみました。科学的な実験ではありませんが、テキスト、コンピューター、マイク、環境はすべて同じです。Dragonの音声認識の方が明らかに優れていましたが、どちらの結果も完璧とは程遠いものでした。これは主に、段落に固有名詞が複数含まれていたためです。それでも、この結果はWindowsの音声認識が間違いなく使えることを示しています。特に、音声認識によって作業がどれだけ速く、あるいは楽になるかを評価したいだけであればなおさらです。

DragonがWindowsの音声認識に対して提供する付加価値は、認識品質と追加機能の2つです。単一段落テストを除けば、Dragonの認識性能は特に一般的な散文において優れていると感じました。長いメールを口述筆記しても、多くの誤りを訂正する必要はなく、自然な声で、他人に話すときと発音や話し方を変える必要もありませんでした。言い換えれば、Dragonのコア機能は成熟しており、現場でテスト済みであり、実際に機能していると感じます。
数値化するのは難しいですが、以前のバージョンであるNaturallySpeaking 11.5と比べて、少し速く、正確になったと感じます。Dragonが私の発話を誤解した場合でも、提示された修正候補は大抵正確で、私が実際に言おうとしていた内容も含まれていることが多かったです(含まれていない場合は、Dragonに新しい単語を教えることもできました)。
付加価値のもう1つの要素である追加機能は、それほど充実していません。Dragon NaturallySpeaking Premiumに音声ファイルを入力すれば、テキストを文字起こししてくれる機能など、素晴らしいものもあります。この機能を使えば、パソコンから離れているときや外出しているときでもスマートフォンで音声を録音でき、素晴らしい結果が得られます。しかし、その他の機能はそれほど洗練されていません。例えば、2つのUSBマイク(ウェブカメラとヘッドセットなど)を、マイクの再調整なしで切り替える明確な方法がありません。

DragonはAndroidとiOS向けのリモートマイクアプリをサポートしました。これにより、スマートフォンをワイヤレスマイクとして使ってライブディクテーションを行うことができます。Androidアプリの設定はQRコードをスキャンすることで行えますが、私の場合、Dragonが表示するQRコードにはコンピューターのIPアドレスに関する誤った情報が含まれていたため、Androidアプリはデスクトップアプリに接続できませんでした(Dragonは実際のネットワークアダプターではなく仮想ネットワークアダプターを選択しました)。幸い、Androidアプリは手動で設定することも可能で、私は手動で設定しました。
Android アプリは、携帯電話のディスプレイがオンになっている間は Dragon で正常に動作していましたが、ディスプレイをオフにした瞬間に動作しなくなりました (ディスプレイがオフになっていても携帯電話はネットワークに接続されたままでした)。
Dragon 12の優れた新機能はWebメール連携です。Dragon 12には、GmailとHotmailとの連携を可能にするブラウザ拡張機能が付属しています。Gmailでテストしてみましたが、問題なく動作し、受信者の選択、件名の指定、メールの音声入力ができました。また、音声だけでメールを送信できないのも気に入っています。これは誤送信を防ぐのに非常に役立ちます。

Dragon 12の新機能として、「入門」チュートリアルが追加されました。Dragonの機能とコマンドの概要を簡単に説明します。Windowsの音声認識チュートリアルよりもはるかに短いですが、初心者がすぐに使いこなせるようになり、音声認識の面白さを実感できる、ありがたい追加機能です。
NaturallySpeakingには、ディクテーション以外にも多くの機能が搭載されています。テキストの書式設定、アプリケーションの起動、Web検索など、様々な機能があります。これらの機能の多くはアクセシビリティを必要とするユーザーにとって不可欠なものであり、専用の製品ではなくDragonのメインバージョンに組み込まれているのは素晴らしいことです。
ただし、Dragon のメリットを享受するためにこれらの高度な機能を使用する必要はありません。音声認識が環境とワークフローに適している場合は、Dragon の優れたディクテーション機能だけでも、Dragon は優れた投資になります。