Google Now が、尋ねられる前に常に自発的に情報を提供してくれる陽気なパーソナルアシスタントだとすれば、Microsoft のインテリジェント仮想アシスタントの将来は、静かにそばにいて必要に応じて提案してくれる執事に近いものになるだろう。
実際、マイクロソフトがGoogle NowやAppleのSiriに対抗する製品を開発するとは期待できない、とマイクロソフトのBing検索担当ディレクター、ステファン・ワイツ氏はPCWorldのインタビューで語った。ワイツ氏によると、マイクロソフトの個々の製品は、Facebook、Foursquare、LinkedIn、Yahoo!など多くの企業との提携を通じてマイクロソフトが蓄積してきた膨大なデータにアクセスできるようになる。これは、独立したアプローチを好んできたGoogleが達成できる範囲をはるかに超えるものだという。
いいえ、Microsoft Bob は、2013 年向けにアップデートされた、お洒落な新しいヒップスター メガネを携えて戻ってくるわけではありません。しかし、Bob コンセプトのビッグ データ バージョン、つまり、必要なときに正確にパーソナル アシスタンスが受けられる機能は、間違いなく Microsoft のレパートリーに加わることになります。
その中心にあるのは、同社の一般向け検索エンジンであるBingです。その舞台裏では、マイクロソフトは仏教の悟りへの道の第一歩にちなんで名付けられた「Satori」エンジンの開発に注力しています。マイクロソフトによると、Satoriの目標は、Bingがいつでも利用できる「世界最大の知識の宝庫」を構築することです。Satoriは、Bing内で情報を整理し、個々のアプリケーションをポータルとしてユーザーへの配信に利用します。

私たちの周囲には、日々膨大な情報があります。位置情報、周囲のお店やランドマーク、友人との距離、その他データポイントなどです。一般的に、これらの情報は、ユーザーがBingで検索するか、アプリを起動させるような操作を行うまで、ユーザーからは見えません。ワイツ氏によると、マイクロソフトのアプローチには2つの利点があります。それは、利用できるデータの幅広さと、Satoriエンジンの受動的でリアクティブなアプローチです。ワイツ氏は、Google Nowはそれに比べると押しつけがましすぎると主張するでしょう。
では、Satoriは実際にはどのように機能するのでしょうか?ワイツ氏は、Bingが2人のユーザー間のチャットセッションを監視し、適切なタイミングで静かに介入するMicrosoftのデモについて説明しました。「IMで話している間、Bingは発話を分析します」とワイツ氏は言います。「『ねえ、映画を見たい?』といった質問に対して、その発話を取り込み、自動的にクエリを実行します。」ワイツ氏によると、この技術は2年以内に製品に組み込むことができるとのことです。

同様の例が、Microsoftの最近のBuild 2013カンファレンスでもデモされました。Bingのバイスプレジデントであるグルディープ・シン・ポール氏は、Bingマップで表示される建物に、建築家の情報などを含む追加のコンテキストをBingが提供していることを披露しました。また、Bingの機能強化も展開が開始されており、Xbox Oneの検索機能の改善、Microsoft Officeへのライブデータ提供、Windows 8.1の検索結果の拡張、Local ScoutなどのWindows Phoneアプリなどがその例です。これらすべてが、Bing内の改善されたナレッジベースを活用して、より適切なコンテキスト情報を提供しています。
ワイツ氏によると、これはマイクロソフト製品にBingの知識を「注入」するプロセスのごく初期段階にあるという。「私たちはそれを自然なものにしたいのです」とワイツ氏は述べた。「だからこそ、この[Bingの技術]を個々の製品チームに提供し、各チームがそれを自由に組み込んで、ユーザーにとって自然なものにできるようにしているのです。」
同じ機能がサードパーティ製アプリにも提供されます。Build 2013において、マイクロソフトは今年後半にBingの知識をサードパーティ開発者に提供開始すると発表しました。「アプリには目があり、耳があり、口があると信じています」とポール氏は述べました。
そして、脳もより良くなります。

バルマー、ゲイツからの祝福
誤解しないでください。ワイツ氏とポール氏は、お気に入りのプロジェクトについて憶測を飛ばすような、無法者のエージェントではありません。これこそが、マイクロソフトが向かう方向なのです。
ここ数週間、マイクロソフトの二人の顔、CEOのスティーブ・バルマー氏と会長のビル・ゲイツ氏は共に、マイクロソフトの将来の大部分は、ユーザーから収集する個人情報と職業情報の収集、整理、分析にあると示唆している。確かに、マイクロソフトはAppleとGoogleを追いかけることになるだろう。プライバシーへの影響も当然あるだろう。そして、その恩恵を最大限に享受するには、ユーザーはマイクロソフトのエコシステム、そしてそのソフトウェアとサービスの集合体を受け入れなければならない。しかし、もしあなたがウェブ上の他のサービスで情報を共有したことがあれば、マイクロソフトが既にあなたのプロファイルを構築している可能性が高い。
3週間前、バルマー氏は、マイクロソフトをデバイスとサービスを中心とした組織へと導くための、抜本的な組織再編を発表しました。しかし、バルマー氏がその計画を概説したのは、補足的な戦略メモの中でのことでした。
「当社の機械学習インフラは、人々のニーズと世の中で利用可能なものを理解し、情報と支援を提供します」とバルマー氏は記している。「人々の日常生活におけるニーズを予測し、必要な時に洞察と支援を提供することに長けています。人生で最も重要なタスクやイベントに関しては、特に細心の注意を払います。行われた調査、収集・分析されたデータ、行われた会議や議論、そして費やされた資金はすべて、人生の重要な瞬間に人々の価値を高めます。」
それだけではありません。先週、ビル・ゲイツ会長はマイクロソフトの「リサーチ・ファカルティ・サミット2013」を主催し、ここでもインテリジェント・アシスタンスの未来への道筋を示しました。

「誰もがパーソナルエージェントとでも呼ぶべきものを手に入れるようになると――これは何十年も前から議論されてきましたが、今や現実のものとなりました――私たちはあなたの行き先、カレンダー、様々なコミュニケーションを把握し、それらのコミュニケーションの一部にはタグやスピーチも含まれ、あなたの活動に役立つよう努めます」とゲイツ氏は述べた。「私たちはより密接につながり、誰かが特定の種類のギフトを探したり、特定の方法で旅行をしたいと思ったりした時、より適切なマッチングができるようになるでしょう」
Microsoft Bob は復活するのか?
残念ながら、インテリジェントエージェントに関しては、Microsoftは波乱万丈の過去を歩んできました。Siri Inc.(後にAppleに買収され、同社の技術はAppleのSiriサービスの基盤となっています)の共同創業者であるアダム・チェイヤー氏は、いくつかの成功例を私に教えてくれました。Windows Vistaで初めて登場したアニメーションアシスタント「Merlin」を搭載したMicrosoft Agent技術、Windows版Microsoft Office 97で登場した「Clippy」の愛称で知られるOffice Assistant、会話内容に基づいて「感情」を割り当てるグラフィカルIRCプログラムであるMicrosoftのComic Chat、そして「バーチャル秘書」であるMicrosoftのスケジューリングシステム向けパーソナルアシスタントなどです。
マイクロソフトは音声検索エンジンの TellMe Networks と PowerSet も買収したが、目立った成功の兆候はほとんど見られなかったと Cheyer 氏は指摘した。

「彼らの商用システムのほとんどはまだ大きな成功を収めておらず、今回の2つの買収で得られた技術が消費者向け製品として登場するのを見たことがありません」とチェイヤー氏はメールで述べた。「Bing Mobileの音声インターフェースを最後に試したのは約3年前ですが、当時はSiri、Google、Nuance、そして(当時は独立系企業だった)Vlingoと比べてかなりひどいと感じました(その後改善されているかもしれませんが)。」
そしてもちろん、Microsoft Bobもありました。これは、既存のMicrosoftテクノロジー(カレンダーなど)への比喩的なインターフェースで、Microsoftが1995年にリリースしたものです。インテリジェントエージェントというよりは、PCのユーザーフレンドリーなガイドという側面が強いBobは、後にビル・ゲイツと結婚するメリンダ・フレンチによって支持されました。(ビル・アンド・メリンダ・ゲイツ財団の広報担当者は、私たちのインタビューの依頼を断りました。)
ゲイツ氏はファカルティサミットで、マイクロソフト・ボブが墓から蘇るかもしれないと示唆し、オタクたちの想像力を掻き立てた。「ボブは再び現れるだろう。ただし、より洗練された形で」とゲイツ氏は述べた。「これまでの多くの失敗と同様に、私たちは時代を先取りしていただけだ」
20年近く経った今、ボブがどうやって成功したのか想像しにくい。「当時はインターネットも存在せず、ボブが賢くなる術もありませんでした」とワイツ氏は語る。「エージェントベースで、明確なルールセットがありました。もし今、同じことをすれば、もっと面白い製品が作れるでしょう。しかし、マイクロソフトは正式にMicrosoft Bobを復活させるつもりはありません」
まとまりがない?
問題があるとすれば、マイクロソフトのアプローチは断片的すぎるかもしれないということだ。ユーザーが困ったときに頼れる、頼りになる単一のアプリケーションがないのだ。Siri Inc.とAppleでSiri製品チームに携わったモハメド・アブドゥルカリム氏は、こうしたユーザーエクスペリエンスはモバイル分野で特に重要だと述べている。
マイクロソフトがモバイル分野で本格的なプレーヤーになりたいのであれば、ライバルと競争するためにSiriのような単一の製品を開発する必要がある、と現在アクティビティトラッカー開発会社ミスフィット・ウェアラブルズの製品マネージャーを務めるアブドゥルカリム氏はベトナムからの電子メールで述べた。
「私たちが目にしてきたのは、検索エンジンがウェブ上の膨大なデータを検索するための事実上の出発点となっているということです。そして、それは当然のことでした」とアブドゥルカリム氏は記しています。「ウェブ上では、ユーザーは自分の検索クエリに最も関連性の高いウェブコンテンツを見つけたいと考えていました。

「モバイルでは、問題は異なります」とアブドゥルカリム氏は言います。「今、ユーザーは意思決定の段階にあります。一番美味しいブリトーはどこで手に入るのか?映画に間に合うにはいつ家を出るべきなのか?今夜のパーティーには他に誰が来るのか?このような状況では、ユーザーは移動中で、必要なことをこなす必要があります。しかも、迅速に行う必要があります。つまり、モバイルデバイスでクエリを入力することは不可能です。クエリを入力し終える頃には、その瞬間は過ぎ去り、一緒にいる友人たちは既にどの映画を見に行くかを決めているのです。そこで、音声ベースの自然言語インターフェース(Siriの場合)とコンテキスト情報(Google Nowの場合)が登場し、意思決定プロセスをスムーズにします。」
公平を期すために言えば、マイクロソフトがBing検索アプリケーションをモバイル体験の中心に据えることを妨げるものは何もありません。ワイツ氏は、ユーザーに「うっとうしいおじさん」のように情報を押し付けるのではなく、ユーザーが検索条件を自由に決められるようにするというマイクロソフトの姿勢を擁護しました。
マイクロソフト自身のテストによると、Google Nowのような技術の精度は88~89%に過ぎず、システムが間違った予測をした場合、ユーザーはいわゆる「信頼のペナルティ」を課すことになる。「しかし、ユーザーがリクエストを開始すると、予測技術の精度は劇的に向上します」とワイツ氏は述べた。
実際、マイクロソフトが懸念すべきはAppleとGoogleだけではありません。Nuance CommunicationsはDragon Naturally Speakingソフトウェアを所有しており、セマンティック技術プロバイダーのCognition(同社の技術はBing向けにマイクロソフトにライセンス供与されていました)などの企業を買収しています。そのため、Nuanceがプラットフォームに依存しないインテリジェントエージェントの開発計画を独自に進めているのも当然と言えるでしょう。
「ウィンターミュート」と呼ばれるこの技術は、今年1月にラスベガスで開催されたコンシューマー・エレクトロニクス・ショーで披露されました。Nuanceは、ATMからガソリンスタンド、電話、テレビまで、あらゆる種類のコネクテッドデバイスが、同社のクラウドベースのインテリジェントエージェントによって稼働することを想定しています。
「今後、パートナー企業はクラウド上で共通のパーソナルアシスタントを搭載した、より多くのフォームファクターを提供できるようになり、デバイスをまたいだパーソナライズされたエクスペリエンスの向上が期待されます」とNuanceの広報担当者は述べています。「消費者向け製品とは異なり、プラットフォームであるため、正式な『リリース』はありません。実際、Nuance Swypeのバックアップ&同期機能は、ユーザーのパーソナライズされた言語モデルがデバイス間で同期されるWintermuteプラットフォームの最初のバージョンです。」

インテリジェントエージェント技術を正しく開発する者は、ユーザーをエコシステムに囲い込むと同時に、膨大な量の有用なデータを収集できる可能性がある。ゲイツ氏(彼なら当然知っているはずだ)によれば、改良されたインテリジェントエージェントの開発は「商業的に非常に大きな成果」をもたらすだろうという。
コンピューターはフランケンシュタインの怪物の理想形として誕生しました。極めて愚かで従順ですが、適切に指示されると、最も強力なツールの一つとなります。長年、コンピューターは人間の命令に従ってのみ動作していました。そして、コンピューターは互いに会話するようになりました。私たちはコンピューターに重要な出来事を思い出させるように指示しました。検索エンジンという形でコンピューターに質問を投げかけるようになりました。コンピューターは私たちの意図や話し方のパターンを学びました。そして今、私たちはコンピューターに役に立つように教え始めたばかりです。
携帯電話、DVR、デジタルカメラ、MP3など、数多くのテクノロジーが市場を塗り替え、社会を変革してきました。インテリジェントエージェントもその一つと言えるでしょう。ワイツ氏は、「携帯電話やパソコンが、特に何も言わなくても、関連情報をポップアップ表示してくれるようなインテリジェントエージェントは、魔法と見分けがつかないほどです」と述べています。
「私は昔からのオタクなんです」とワイツ氏は言った。「でも、これを見ると本当に鳥肌が立ちます」
訂正: Microsoft の広報担当者によると、Satori は特定のユーザーに関する情報は収集せず、Web から人物、場所、物に関する情報を収集します。