Latest evidence-based health information
Ipad

マイクロソフトによると、コパイロットのAIはユーザーを「見て」話しかけることができるようになるという。

マイクロソフトによると、コパイロットのAIはユーザーを「見て」話しかけることができるようになるという。
マイクロソフトによると、コパイロットのAIはユーザーを「見て」話しかけることができるようになるという。

Microsoftは本日、Windows 11の次期機能アップデートであるWindows 11 2024 Updateの提供を開始します。しかし、Microsoftの取り組みはまだ終わりではありません。Copilot Voice、Copilot Vision、Cop​​ilot Dailyなど、今秋リリース予定のCopilotの新機能を先行公開しています。

表面的には、Copilotの新機能は、OpenAIが今年初めにリリースしたマルチモーダルChatGPT(またはGPT-4o)に似ているように見えます。ChatGPTは「見る」ことができるようになり、高度な音声機能により会話が可能になります。しかし、MicrosoftとOpenAIが提供する機能にはいくつかの重要な違いがあり、MicrosoftのCopilotのイノベーションのうち、すぐに利用できるのは一部のみとなります。

しかし、Copilot Voiceが最も重要な追加機能になるだろうと断言できるでしょう。Copilot Visionはそうではないかもしれません。実際、Copilot Visionは、Microsoftの物議を醸した検索機能Recallの別バージョンに過ぎないと考える人もいるかもしれません。Recallは、ユーザーがより徹底的にテストするまでMicrosoftが延期している機能です。

知っておくべきその他の Microsoft の最新ニュース:

  • Windows 11の2024年大型アップデート:入手方法と時期
  • マイクロソフトがWindows 11のAIロードマップを公開:スマート検索、アップスケーリングなど
  • Windows 11 の 2024 年アップデート: 気に入っている 5 つの大きな変更点 (およびその他)

現状はこうです。MicrosoftはBing Chat(後にCopilotと改名)を市場にいち早く投入した企業の一つです。しかし、Google、OpenAI、Meta、Anthropicなど、多くの企業が独自のLLM(法学修士)とサブスクリプションをリリースし、それらに連動しています。Microsoftは当然のことながら、Copilot Plusサブスクリプションの正当性を常に示し続けなければなりません。これらの新機能のうち、Copilot Visionや「Think Deeper」などはCopilot Labsでのみ利用可能となり、Copilot LabsはCopilot Plus加入者に限定されます。

Copilot Visionは、物議を醸したRecall機能に似ているように聞こえますか?確かに似ています。だからこそ、Copilot Visionの導入は遅れるでしょう。しかし、Copilot Voice、Copilot Daily、Microsoft Edge向けのアップデートされたCopilot、そしてPersonalized Discover機能といった他の機能は完全に無料で、まもなくリリースされます。

これらの新機能は、iOSとAndroid向けの新しいCopilotモバイルアプリ、Windows向けのアップデートされたCopilotアプリ、そしてcopilot.microsoft.comの新しいデザインの一部として本日公開されます。Microsoftは、おそらくGoogleに倣って、Bingにおける生成検索も強化しています。

ただし、これらの新しいCopilot機能はCopilot+ PCを必要としません。これらのCopilot機能はクラウドで実行されます。Microsoftは、Copilot+ PC内のNPUに依存する新しいAI機能をWindowsに導入します。これらの機能は、フォトのAIアップスケーリングやペイント内のジェネレーティブフィルなど、非常に優れています。これらについては、別の記事で取り上げています。

Microsoft Windows 11 コパイロット デイリー
PC 上で実行される Copilot Daily。

マイクロソフト

Microsoftの新機能Copilotの機能解説

Copilot Voiceは、間違いなく最もインパクトのある新機能のように思えます。少なくともデモでは、Copilot VoiceはChatGPTの音声機能と非常によく似ていました。マイクロソフトはスマートフォン上でこれを実演し、ユーザーがスーパーマーケットにいて、パーティーに友人に何を持っていけばいいのかわからないと告白するという架空のやり取りを披露しました。会話には、ChatGPTがまるで人間のように聞こえるようにする機能である割り込みや、説明(高級オリーブオイルとは何ですか?)などが含まれていました。これが最終製品の典型的な例であれば、役立つ可能性があります。

Copilot Voiceと同様に、マイクロソフトはスマートフォン上で動作する新しいCopilotエクスペリエンスを披露しました。おそらくマイクロソフトは、AIがユーザーにとって関連性が高いと判断したニュースの見出しを音声で要約する「Copilot Daily」を聴いて一日を始めてほしいと考えているのでしょう。(おそらくPCでもこれらの機能にアクセスできるでしょう。)

Copilot Dailyは、Microsoftがユーザーを助けようと試みた、まさにその成果の一つに過ぎません。10年前、Cortanaはユーザーの1日のスナップショットを提供しようとしていました。2020年のCortanaのDaily Briefingは、会議の概要と準備に必要なことを記載したメールを送ってくれます。Copilot Dailyの短いデモでは、そのような機能は一切なく、アルプス山脈、アメリカの年末商戦、サーフィンをする犬に関するニュース記事の要約が表示されました。

Copilot Daily は基本的に、ロイターや Axel Springer などのパートナーと共同で提供している Microsoft の Start を音声形式で提供したものです。

Microsoft Windows 11 Copilot パーソナライズされた Discover カード
これは Copilot のパーソナライズされた Discover です。

マイクロソフト

Personalized Discoverがより生産性の高い代替機能になるかどうかは、まだ分かりません。Microsoftがこの技術をざっと見たところ、Edgeの新規タブページの情報量を増やしただけのものに見えました。件名は「チャット履歴に基づいて、時間の経過とともにさらにパーソナライズされる」とのことです。繰り返しますが、この機能は一時的なものに過ぎません。Microsoft EdgeのCopilotのアップデートも同様です。これにより、アドレスバーに「@copilot」と入力することで、チャットで同僚のようにCopilotに話しかけることができるようになります。

興味深いことに、有料機能であるCopilot Visionは、 GoogleのProject Astraや競合他社がこれまで提供してきたマルチモーダルAIとは異なります。完全にPC上で動作し、画面に表示されているものを解釈するだけです。

実際、これは私が最近見たデモの中でも最も期待外れだったと言えるでしょう。ある例では、ユーザーがRotten Tomatoesを閲覧しながらCopilotに映画のおすすめを尋ねていました。会話はCopilot Voiceを介して音声で行われていましたが、チャットボットは画面に表示されている内容を読み上げるだけでした。ページを要約できるのは理にかなっているかもしれませんが、あまり良い例ではありませんでした。

一方、別のデモでは、ユーザーが祖母が書いたレシピを閲覧していました。Copilot Visionは、ページから得た情報ではなく、レシピにかかる時間をインテリジェントに提案しました。Copilot Visionが提供してくれるのも、まさにそのような機能です。

Microsoft Windows 11 Copilot Vision の例
この例では、ユーザーは Copilot に映画「Lee」について詳しく尋ねるように依頼しました。Copilot Vision は画面に表示された概要を読み上げるだけです。

マイクロソフト

これを、物議を醸したリコールの単なる別バージョンと捉える人もいるだろう。リコールは既にマイクロソフトがユーザーがオプトアウトしたり、インストール自体を一切行わないようにするなど、細心の注意を払っている。マイクロソフトによると、Copilot Visionは完全にオプトイン方式で、Copilot Visionによって収集されるデータは「一時的なもの」であり、(少なくともプレビュー版では)保存されず、すぐに破棄されるという。また、マイクロソフトは「Copilot Visionが対応できるウェブサイトの種類に制限を設ける」としており、特定のサイトをホワイトリストに登録する。最後に、今回のプレビュー版では、Copilot Visionは「有料コンテンツやセンシティブなコンテンツ」には対応しない。金融ウェブサイトやプライベートブラウジングなどが含まれるかどうかは明らかにされていない。

マイクロソフトはCopilot Visionについて、「一般公開する前に、Copilot Labsの初期ユーザーからのフィードバックを継続的に取り入れ、安全対策を改良し、プライバシーと責任をあらゆる活動の中心に据えていきます」と述べた。

Microsoft Windows Copilot より深く考える
Microsoft がこれを Think Deeper と呼ぶのか、それとも Think Deep (ここで示されているように) と呼ぶのかは明らかではありませんが、より思慮深い Copilot になることが期待されます。

マイクロソフト

マイクロソフトは、今後リリース予定の「Think Deeper」機能が、熟考したり推論したりできるAI「GPT4-o」と本質的に同じものかどうかについては言及していない。「Think Deeper」は、応答するまでにもう少し時間がかかる。「最新のAI技術を活用することで、難しい数学の問題を解くことから、家のプロジェクト管理にかかる費用の見積もりまで、あらゆることに役立ちます」とマイクロソフトは述べている。

Copilot Voiceは、おそらく本日中に米国、カナダ、英国、その他の地域で利用可能になります。Copilot Dailyとパーソナライゼーションオプションも本日から利用可能です。Think Deeperも同様にCopilot Proユーザーにプッシュされます。ただし、Copilot Visionは「将来」Labsに、限られたユーザー向けにリリースされる予定です。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.