Latest evidence-based health information
Vision

GoogleがAIテキスト検出ツールをオープンソース化、誰でも利用可能に

GoogleがAIテキスト検出ツールをオープンソース化、誰でも利用可能に
GoogleがAIテキスト検出ツールをオープンソース化、誰でも利用可能に

「PCWorldは、読者の心に響く情報を掘り下げ、多面的なタペストリーを創り出し、深遠なる豊かさの風景を伝える旅を続けています。」このくだらない文章はAIが生成したように聞こえるかもしれませんが、実際には生身の人間、つまり私自身が書いたものです。

実のところ、特定のテキストがAIによって生成されたものなのか、それとも実際に人間が書いたものなのかを見分けるのは難しい。Googleは、新しいソフトウェアツールをオープンソース化することで、その見分けを容易にしたいと考えている。

GoogleはこれをSynthIDと呼んでおり、「AI生成コンテンツに透かしを入れて識別する」手法です。これまでGoogle独自の言語・画像生成システムに限定されていましたが、同社はSynthIDをオープンソースコードとして公開し、他のAIテキスト生成システムにも適用できるようにすると発表しました。(もし私よりもコンピュータサイエンスに詳しい方は、権威あるNature誌で詳細をご確認ください。)

しかし、素人言葉で言えば(少なくともこの素人が実際に理解できる程度には)、SynthID は、人間が通常は見分けるのが微妙すぎる画像やテキスト内の特定のパターンを隠し、テスト時にそれを検出する仕組みを備えている。

オープンソースの機械学習データベース「Hugging Face」の投稿によると、SynthIDは「基盤となるLLMの動作に影響を与えたり、生成品質に悪影響を与えたりすることなく、テキストがLLMから生成されたかどうかを判断するのに役立つ方法で、AI生成テキストに透かしをエンコードできます」。

良いニュースとしては、Googleによると、これらの透かしはほぼあらゆるAIテキスト生成ツールに統合できるとのことです。悪いニュースは、透かしを実際に検出することがまだ完全には確立されていないことです。

SynthID 透かしは、自動検出を回避するために使用されるいくつかの基本的なトリック (「盗作と呼ばないでください」という単語の入れ替えなど) を回避することができますが、透かしの存在を示すことができるのはさまざまな確実性だけであり、その確実性は、生成テキストの最も重要かつ問題のある使用法の一部である「事実の応答」に適用された場合、および大量のテキストが自動翻訳またはその他の書き換えを経由する場合に大幅に低下します。

「SynthIDテキストは、動機のある敵対者が危害を加えるのを直接阻止するために設計されたものではありません」とGoogleは述べています。(そして率直に言って、たとえGoogleがLLM生成の誤情報に対する万能薬を開発しとしても、責任の問題からそれをそのように位置付けることには躊躇するでしょう。)また、テキスト生成ツールを実際に使用する前に、透かしシステムを統合する必要があるため、悪意のある国家機関や、xAIのGrokのようなより明確に「無料」のツールが行うように、誰かが単にそれをしないことを選択することを妨げるものは何もありません。

ここでGoogleが必ずしも社交的ではないことを指摘しておかなければなりません。同社は消費者と企業の両方に独自のAIツールを積極的に展開していますが、その中核となる検索サービスは、自動生成テキストや画像で急速に埋め尽くされつつあるウェブの脅威にさらされています。OpenAIのようなGoogleの競合他社は、単にビジネス上の都合でこうしたツールを使わないことを選択し、独自の標準を確立して市場を自社製品へと誘導しようとするかもしれません。

著者: Michael Crider、PCWorld スタッフライター

マイケルはテクノロジージャーナリズムのベテランとして10年のキャリアを持ち、AppleからZTEまであらゆるテクノロジーをカバーしています。PCWorldではキーボードマニアとして活躍し、常に新しいキーボードをレビューに使用し、仕事以外では新しいメカニカルキーボードを組み立てたり、デスクトップの「バトルステーション」を拡張したりしています。これまでにAndroid Police、Digital Trends、Wired、Lifehacker、How-To Geekなどで記事を執筆し、CESやMobile World Congressなどのイベントをライブで取材してきました。ペンシルベニア州在住のマイケルは、次のカヤック旅行を心待ちにしています。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.