Latest evidence-based health information
Iphone

Nuance、新しいDragon AnywhereでAndroidとiOSに音声認識機能を搭載

Nuance、新しいDragon AnywhereでAndroidとiOSに音声認識機能を搭載
Nuance、新しいDragon AnywhereでAndroidとiOSに音声認識機能を搭載

ニュアンス・コミュニケーションズは火曜日、同社の人気ディクテーションアプリ「Dragon」のiOSおよびAndroid向け幹部が「真の」モバイル版と呼ぶものを発表した。クラウド接続サービスにより、これらのアプリをWindowsおよびMac向けの新しいアップデートアプリに橋渡しするものだ。

Dragon Anywhereと呼ばれるこの新しいプラットフォームは、Nuanceのモバイルアプリと、それらの録音データをMac版Dragonの新バージョンとWindows版Dragon Professionalの廉価版であるDragon Professional Individualに接続するサービスで構成されています。Dragon Anywhereはクラウドベースではなく、処理はクラウド上で行われます。クラウドは、さまざまなDragon製品間でファイルを送受信する機能のみを備えています。 

ドラゴンエニウェアフォンのログイン画面

Nuance Dragon Anywhere は、iOS と Android の両方に対応するように設計されています。

しかし、競合も現状に留まっているわけではありません。Dragon NaturallySpeakingが1997年に登場した当時、Windowsでテキストを音声入力することは、MicrosoftがWindows OSに独自の音声入力機能を組み込んだ後でさえ、目新しいものでした(Windows 10でもまだ利用可能です)。しかし今日では、MicrosoftのCortana、AppleのSiri、Google Nowに音声で指示を出すことは比較的一般的です。ご希望であれば、iOS版Dragon Dictationを購入したり、Swypeキーボードに内蔵されているマイク機能を使用したりすることも可能です。

「しかし、それはすべて、実際の文書作成ではなく、短い内容に調整されています」と、Dragon の上級副社長兼ゼネラルマネージャーであるピーター・マホニー氏は、PCWorld とのインタビューで語った。

これがなぜ重要なのか: オペレーティングシステムに音声による操作が組み込まれていることから、Nuanceはユーザーが音声入力をより頻繁に利用し、日常的に使用しているオペレーティングシステムの限界をすぐに理解するようになることを期待しています。同時に、Nuanceの新しい価格モデルは、消費者が無料であることに慣れつつあることをわずかに反映しているに過ぎません。しかし、Nuanceの幹部は、Dragonはプレミアム製品であり、プレミアム価格であることも明確にしています。

外出先でのディクテーション

Dragon Anywhereのアイデアは、ユーザーが外出先でメモを書き始め、それをクラウドに保存できるというものです。その後、スマートフォンまたはデスクトップアプリでセッションを再開できます。 

Android版とiOS版のDragon Anywhereは、デスクトップ版と同じDragonエンジンを使用しています。ユーザーは音声を使ってエンジンを学習し、カスタマイズした単語、音声ショートカット(マクロのようなもの)、よく使うテキストを利用できます。マホニー氏によると、この2つのモバイルアプリは今秋、月額15ドルまたは年額150ドルのサブスクリプション形式で販売される予定です。

NuanceはDragon Professionalソフトウェアのライセンス価格を1つ600ドルと設定しました。これはディクテーションソフトウェアとしてはかなり高額です。火曜日には、Nuanceはより安価なオプションであるDragon Professional Individualを300ドルで提供します(Dragon Professionalバージョン12以上からのアップグレードの場合は150ドル、Dragon Premiumバージョン12以上からのアップグレードの場合は200ドル)。こちらもカス​​タム単語、テキストマクロの作成、反復タスクの自動化機能などを提供します。

ドラゴンのどこでもコマンド

Dragon Anywhere で使用できるコマンドの一部。

NuanceはMac版Dragonも提供し、米国、英国、オーストラリアで9月上旬に200ドルでダウンロード提供を開始します。Mac版Dragon Dictateバージョン3以降の登録ユーザーには、特別アップグレード価格100ドルが適用されます。Mahoney氏によると、Windows版と同じコアDragonエンジンを搭載していますが、自動化コンポーネントなど一部の機能が欠けているとのこと。ただし、Windows版と同様に、Dragon Anywhereと連携できます。

新しいDragonソフトウェアは完全に話者依存型であり、つまり実際には一人の話者、つまりあなた向けに設計されているということです。しかし、Mahoney氏はDragon Professionalの機能も披露しました。MP3などの音声ファイルをインポートし、Dragonソフトウェアで実行できる機能です。インポートすると、エンジンをその話者向けに「トレーニング」するように求められ、再生中の音声の最初の1分間を修正します。その後、Dragonはその話者モデルを残りの音声に適用します。ただし、いくつか注意点があります。音声は16KHz以上でサンプリングする必要があり、話者は一人しか含めることができません。Dragonは将来、複数の話者による音声の書き起こしが可能になると期待していますが、まだ実現には至っていません。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.