
コンピュータに話しかける方が効果的な場合もあります。特に、Nuance Dragon NaturallySpeaking 11.5 Professionalのような音声認識プログラムを使用している場合はなおさらです。このソフトウェアを使えば、文書やメールの作成、PCの操作、Web検索など、すべて音声で行えます。このバージョンはDragon NaturallySpeaking 11のリリースから1年も経たないうちにリリースされました。基盤となる音声認識エンジンは変更されていませんが、今回のアップデートにはインターフェースの便利な調整がいくつか施されており、iPhoneユーザーやソーシャルネットワーキング愛好家にとってすぐに役立つ機能が追加されています。
Dragon NaturallySpeaking 11.5 Professional(2011年7月26日時点で600ドル。バージョン11の既存ユーザーは無料アップグレード)を使うと、iOS 4.2以降を搭載したiPhoneまたはiPod Touch(第4世代)をディクテーションマイクとして使用できます。これにより、ヘッドセットでコンピュータに縛り付けられる必要がなくなります。また、簡単なコマンドを使ってFacebookやTwitterに最新情報を投稿することもできます。さらに、Nuanceは作業画面の横に表示されるデスクトップヘルパー画面「Dragon Sidebar」を拡張し、アクティブなウィンドウに基づいてコマンドとヒントのインデックスを表示します。
Nuanceのパッケージには、Andrea Electronics NC-181ヘッドセットマイク(25ドル)が同梱されています。調整可能なヘッドセットとしては、装着感は満足できるレベルだと思います。幅広のバンドがヘッドセットをしっかりと固定し、ブームを口の左右どちらにでも配置できます。NC-181はPCのオーディオジャックに接続します(ただし、電源スイッチなどのインラインコントロールはありません)。
デスクトップダイアログ
Dragon NaturallySpeaking 11.5 をインストールした後、PC に向かってしゃべり始める前に、ソフトウェアは「トレーニング」を完了するように促します。この簡単なプロセスでは、一連の段落を約 5 分間(私の場合)声に出して読みます。私はジョン・F・ケネディ大統領の 1961 年の就任演説からの抜粋を選びました。
Windows XPシステムとWindows 7搭載PCの両方で、最低限のトレーニングを終えた後、バージョン11.5を試用しました。この新リリースの焦点は精度ではありませんでしたが、それでもソフトウェアの認識精度とパフォーマンスを最初から見直したいと思いました。数千語ほどしゃべり続けた後、Dragonはバージョン11と同様に、基本トレーニングだけで期待通りの成果を上げました。長い文書では、精度は98%強に達し、短いディクテーション(短い会話形式のメールなど)ではほとんど編集や修正が必要ありませんでした。
ディクテーションをするときはかなり速く話しますが、Dragonはついてきてくれました。例えば、急いでいたので「telecommunications(電気通信)」という単語でつまずき、「it'll(それなら)」と早口で言ってしまいました。しかし、Dragonはこれらの2つの単語だけでなく、似たような単語やフレーズも、句読点も含めほぼ毎回正確に発音してくれました。音声を使ってWebを閲覧したり、ソーシャルネットワーキングサイトに更新情報を投稿したりするのが簡単だったのが気に入りました。「カリフォルニア州サンカルロス、ウォルナットストリート1602番地の地図を検索」や「Amazonでユニバーサルノートパソコン充電器を検索」といった音声コマンドは、宣伝文句通りの動作をしました。
誤認識と訂正
全体的に見て、Dragonが犯した間違いのほとんどは軽微なものでした。例えば、「on」ではなく「in」(またはその逆)、「do」ではなく「to」、複数名詞ではなく単数名詞(またはその逆)、そして「PIN」ではなく「pen」といった具合です。とはいえ、Dragonの解釈には思わず笑ってしまうものもありました。「while driving(運転中)」と言ったのに「pile-driving(杭打ち運転)」と認識してしまったり、「figure out(理解する)」ではなく「cigarette(タバコ)」と認識してしまったり、「earhook(耳かけ)」ではなく「year hoax(年のおまけ)」と認識してしまったり。感嘆符を付けたかったのに、文末に「excavation point(発掘地点)」と付け加えてしまったりもしました。
新バージョンでは、Nuanceはスペルウィンドウを改良しました。これは私がよく使う機能で、特に珍しい名前を入力する際によく使います。Dragonが誤って書き起こした単語を修正しやすくなりました。ウィンドウのサイズを変更できるようになったので、スペル候補リストが見やすくなりました。しかし、メリットはそれだけです。特にスペルを書いたり正しい単語を入力したりする必要がある場合、修正手順を完了するのは依然として手間がかかると感じました。(正直に言うと、私はマイクを装着するときにイライラしてしまいます。)
iPhoneをマイクとして使う
iPhoneがリモートマイクとしてどれほどうまく機能するか興味がありました。(DragonとiPadやiPod Touchの連携はテストしていません。)結論:iPhoneは問題なくその役割を果たしました。しかし、私の場合、設定は容易ではありませんでした。
無料の Dragon Remote Microphone アプリ (Apple App Store から入手可能) をインストールした後、PC で既存の Dragon ユーザー プロファイルを開き、新しいディクテーション ソースを追加することを指定して、スマートフォンとコンピューターが同じ Wi-Fi ネットワークに接続されていることを確認する必要がありました。Dragon が PC 画面に表示してくれた必要な情報 (Dragon ソフトウェアで作成したユーザー プロファイル名、IP アドレス、ポートの詳細) を iPhone の設定に手動で入力しました。これで iPhone は PC に接続されるはずでした。しかし、接続されませんでした。実際、3 つの異なるワイヤレス ネットワークを試した後、iPhone とコンピューターが突然互いに「通信」できなくなりました。
Nuanceのテクニカルサポートに何度か電話したところ、XPマシンのセキュリティ制限が接続をブロックしている可能性が高いことが判明しました。イライラした私はWindows 7システムに切り替え、少しいじくり回した後、Windows 7のテストシステムとiPhoneがようやく連携しました。(Nuanceのドキュメントには、Dragonリモートマイクアプリがすべての環境で動作するとは限らないことが明記されています。例えば、同社はiPhoneの機能は特定のコーヒーショップやオフィスでは動作しない可能性があると警告しています。)
ヘッドセットのコードから解放され、iPhoneを口から少し離し、画面上のマイクボタンをタップしてオンにし、トレーニングを完了しました。その後、いくつかのメールを音声入力してみましたが、精度は前述のヘッドセットを使った場合とほぼ同じでした。PCから離れてiPhoneに向かって喋り始めたくなる衝動に駆られましたが、音声入力しながら画面に表示される単語を確認するために、とにかくPCの前にいたいと思いました。そこで、頭に装着する器具は使わず、PCに繋がれた状態を維持しました。
Android OSについては、現時点ではDragon Remote Microphoneアプリは提供されていません。しかし、Nuanceの広報担当者は、将来的にこのプラットフォームをサポートする予定だと述べています。
ドラゴンの種類
600ドルのProfessional版は、エンタープライズ管理ツールと高度なカスタムコマンドを必要とするお客様向けです。よりお手頃な音声ディクテーションをお探しの場合は、200ドルのDragon NaturallySpeaking Premiumまたは100ドルのDragon NaturallySpeaking Homeをご検討ください。(注:Dragon HomeではiPhone機能はご利用いただけません。)
お使いのPCが数年以上前のものであれば、ハードウェアがソフトウェアの動作に必要な性能を満たしていない可能性がありますのでご注意ください。Dragon NaturallySpeaking は、Windows VistaおよびXPでは1GHzのCPU、Windows 7では2GBのRAMを搭載したマシンが必要です。ただし、Nuanceの推奨スペックはそれよりも高いものです。システム要件の詳細は、Nuanceのサイトをご覧ください。
Dragon Naturally Speakingのどのバージョンを選んでも、音声ですぐに操作できます。さらに、Premium版またはProfessional版をお選びいただくと、iPhoneをマイクとして利用することで、より自然な音声入力が可能になります。