Latest evidence-based health information
Airpods

Siri の特別な点は何ですか?

Siri の特別な点は何ですか?
Siri の特別な点は何ですか?

iPhone 4S の仮想パーソナルアシスタントである Siri に、なぜそれが素晴らしいのかと尋ねると、Siri は、驚くほど謙虚にこう答えます。「私は私です。」

しかし、業界関係者は、Siriの真価はそれだけではないと指摘する。Siriは音声認識の域をはるかに超えており、強力な人工知能と統計分析を駆使して、質問者の時に支離滅裂な言葉の意味を解読する。さらに、Siriの辛辣なユーモアも加わることで、Siriはスマートフォン、タブレット、さらにはパソコンでも同様の技術の新たな用途を開拓する、大ヒット商品となるだろうと専門家は指摘する。

Siri の特別な点は何ですか?

今こそSiriの時代です。Siriが活用する複雑な技術が、ついに消費者向けに準備されたからです。Siriに近くのレストランを探してと頼むと、Siriは音声認識を使ってリクエストを処理するだけでなく、質問をクラウドに送信します。クラウドでは、強力な人工知能アルゴリズムが言葉遣いを分析し、ユーザーが何を求めているのかを正確に理解し、回答をスマートフォンに返します。そしてSiriは忠実にその指示に従い、例えば近くのメキシコ料理レストランを検索します。3年前でさえ、このようなクラウドベースの分析は不可能でした。私たちは、この技術で何ができるのかを探り始めたばかりです。

音声認識以上のもの

Siriのようなサービスは「自然言語処理」アプリであり、統計モデルを用いて、発音や単語の選択が不明瞭な場合に、ユーザーが何を言いたかったのかを推測します。例えば、自然言語プログラムは、「I like two sailboats around eBay(私はeBayの周りの2つの帆船が好きです)」という文は、おそらく「I like to sail boats around the bay(湾の周りでボートを帆走するのが好き)」であると判断します。

この技術は何年も前から存在しています。銀行のロボット式請求書支払いシステムに「話しかける」たびに、自然言語処理が使われてきました(ただし、多くの銀行では、言語処理がこれまでかなり不十分でした)。

Androidスマートフォンは長年クラウドベースの言語処理を採用してきました。しかし、例えばGoogleの音声操作アプリでは、「…を聞く」や「…にメモする」といった限られたコマンドを使ってコミュニケーションを開始する必要があります。

Siri の特別な点は何ですか?

Siriは人工知能と、ユーザーに関する知識を継続的に蓄積していくことで、ユーザーの発言内容だけでなく、その意図も理解します。そのため、様々な方法で頼むことができます。SiriはiPhone 4Sと連携しているため、ユーザーの現在地や最も頻繁に連絡を取る相手を把握しています。こうした状況認識に基づいて、「近くのタクシーを探して」や「母に電話して」といった指示の意味を理解します。Siriは「マーク・スミスに電話して」だけでなく、「親友に電話して」や「マークと話したい」といった指示にも正しく応答します。

[読んでください: GoogleのルービンがSiriについて理解していないこと]

Siri は何が違うのでしょうか?

ユーザーはSiriにまるで人間であるかのように話しかけることができるだけでなく、そうしたいと思っているようです。Siriは単にユーザーの言葉を理解するだけでなく、個性を持っているからこそ機能するのです。

音声認識プログラムは、私たちの言葉を解釈する際に頑固に間違いを犯してしまうため、時にイライラさせられます。高度な技術が裏でどれほど機能していても、Siriは間違いを犯します。しかし、Siriにとって音声認識は会話であり、人々は会話における誤解に対処することに慣れています。Siriのインターフェースは、人工知能に音声認識をうまく失敗させる方法を与えています。

スタンフォード研究所のベンチャーキャピタル部門であるSRIベンチャーズの副社長、ノーマン・ウィナルスキー氏は、AppleがSiriを買収する以前、Siriチームと仕事をしていました。ウィナルスキー氏によると、チームにとって最も困難な課題はSiriの「声」の開発だったかもしれません。

「今、現象になりつつある個性は、人々を不快にさせることなく魅了する素晴らしい方法です」とウィナルスキー氏は語る。「私たちは、態度が人々を遠ざけてしまうのではないかと非常に懸念していました。チームは綿密に協力し、人々のニーズに応えながらも、不快感を与えない対話を作り上げました。」

Siriの個性は最大の魅力の一つです。ただ楽しいだけでなく、面白​​いのです。Siriに人生の意味を尋ねると、「42」や「これまでの証拠はすべてチョコレートを指している」と答えてくれます。死体を隠したいと伝えると、近くのゴミ捨て場や金属鋳造所を教えてくれます。STSSのようなブログには、Siriの面白い発言を集めたものもあります。

[読んでください: Siri ベースの短編映画トップ 5]

Siri の特別な点は何ですか?

ウィナルスキー氏は、Siriの初代開発チームはアプリに個性を持たせて開発を進めたが、Appleはそれをさらに強調した可能性が高いと述べている。Opus Researchのシニアアナリスト兼創設者であるダン・ミラー氏は、Siriのインターフェースは実に楽しく、まるでゲームのようだと述べている。この魅力的な要素によって、音声認識に残る弱点も多くのユーザーにとって許容できるものになるだろう。

音声認識はどこへ向かうのか?

今後数年間は、自然言語アプリやサービスが爆発的に増加すると予想されます。

「現在起きていることを最もよくまとめると、音声と言語の処理がユーザーインターフェースの基本的な構成要素となり得るという事実に業界が気づき始めているということです」と、人気の音声認識ソフトウェア Dragon Naturally Speaking を開発する Nuance 社の最高技術責任者、Vlad Sejnoha 氏は言う。

Dragonは最近、iOSデバイス向けの自社製モバイル自然言語アプリ「Dragon Go」をリリースしました。Goは特定のタスクでユーザーを支援することに重点を置いています。例えば、医師が複雑な患者の病歴を入力すると、重要な症状を要約して返答します。

Siriは近いうちにさらに多くの機能を追加すると予想されます。Appleの開発者は「現在、いくつかの機能を削除しているので、Siriは急速に進化すると確信しています」とSRIのウィナルスキー氏は述べています。Appleが削除した機能の一つは、レストランのテーブルを自動予約する機能です。Appleは、この機能をアプリに復活させるため、契約を締結し、機能を可能な限り迅速に改良していると思われます。

その後はどうでしょう?Siriがストリーミング音楽アカウントに接続したり、オンラインで航空券を検索したりしてくれるかもしれません。Siriユーザーの数だけ、提案があるかもしれません。

[読んでください: AppleがSiriを改善するためにすべき5つのこと]

しかし、Apple開発者は迅速に行動を起こすべきだ。なぜなら、間もなく激しい競争に直面することになるからだ。「今後数年間で、この新しい構成要素の使い方に関する多くの革新が見られるでしょう」とセジュノハ氏は語る。「私たちはまさにルネサンスの段階にいます。これは終わりではなく、この技術で何ができるのかの始まりに過ぎないのです。」

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.