近年のAIブームが引き起こした現象の一つにディープフェイクがあります。ディープフェイクとは、「ディープラーニング(深層学習)」と「フェイク(偽物)」を組み合わせた言葉です。
ディープラーニングは機械学習の手法を指し、フェイクは贋作、模造品、または偽造品を指します。したがって、ディープフェイクとは、AIプロセスの助けを借りて作成された偽造品を指します。
これらは、既知の人物のコンピューターで生成された偽の写真、顔が別の顔に置き換えられた画像やビデオ、さらには既知の人物が実際には発したことのないフレーズを発した音声録音やメッセージである可能性があります。
このような画像、動画、音声録音の偽造はこれまでも存在してきました。しかし、AI技術のおかげで、これらの偽造品はほぼ完璧になり、本物の録音と区別することが困難になっています。
さらに、必要なソフトウェアは誰でも入手可能で、Web サービスとして提供されることも多いため、今では誰でもディープフェイクを作成できます。
悪用される可能性が高い
ディープフェイクを作成するための AI アプリケーションは、他の人を騙すために使用できるソフトウェアとして宣伝されることがよくあります。
しかし実際には、こうしたプログラムは犯罪者によって悪用されることが多く、AIの可能性を巧みに利用して詐欺行為を行っています。例えば、
- 彼らはAIを駆使して孫詐欺を完璧に実行します。具体的には、AIが生成した親戚の声を使って被害者に電話をかけ、事故などの緊急事態を説明し、即時の金銭支援を求めます。
- 彼らはビデオの中で、政治家が一度も言ったことのない言葉を政治家の口に吹き込み、世論に影響を与えようとした。
- 著名人に、本人の承諾なしに、あるいは本人の許可なく商品を宣伝させる。その結果、その商品を注文した顧客は、法外な価格で騙されるか、商品を受け取ることができないかのどちらかになる。
ディープフェイク画像の認識
ディープフェイク詐欺が始まった当初、消費者は犯罪者に騙されないよう、注意深く見たり聞いたりするしかありませんでした。これは、AIがしばしば不正確に動作し、多くの詳細が誤って表現されたり、非現実的であったりするからです。
しかし、すぐにウェブ上には、画像や動画を精査してこれらのエラーを検知し、色のパターンやテクスチャも分析に組み込むAIアプリケーションが登場しました。現在では、このようなプログラムが数多く提供されており、その多くは無料です。
ユーザーがウェブサイトに画像や動画をアップロードすると、AI がそれを分析し、それがディープフェイクかどうかをユーザーに伝えます。

バッファロー大学のDeepfake-o-Meterは、オープンソースの16種類のプログラムを用いて、画像、動画、音声ファイル内のディープフェイクを認識します。しかし、テストでは、これらのツールのパフォーマンスは納得のいくものではありませんでした。
IDG
おそらくウェブ上で最も包括的なディープフェイク検出ツールは、米国ニューヨーク州バッファロー大学が開発したものだ。同大学のメディアフォレンジック研究所のチームが開発したDeepfake-o-Meterプロジェクトは、オープンソース界隈から16のAI認識プログラムを統合し、ユーザーがアップロードした画像、動画、音声ファイルを入力として利用する。
数秒後、ツールは結果を提示し、アップロードされたメディアが AI によって生成されたディープフェイクである可能性を示します。
Deepfake-o-Meterにアクセスするには、メールアドレスで無料登録するだけです。登録すると、サービス利用時に30クレジットが付与されます。1回のクエリにつき1クレジットかかります。
簡単なテストとして、まずはおそらく世界で最も有名なディープフェイク画像である、Midjourney で作成した白いダウンジャケットを着た故フランシスコ教皇の写真をアップロードしました。
しかし、ディープフェイクメーターのレパートリーの中で、写真が偽物である確率を50パーセント以上と示したサービスはわずか2つでした。

Deepfake-o-Meterが使用した認識プログラムはどれも、白いダウンコートを着たフランシスコ教皇の画像を信頼できるディープフェイクとして認識しませんでした。他のAI画像も同様に確実に認識されませんでした。
IDG
2つ目のテストでは、Canva.comのポートレートジェネレーターを使って女性の画像を生成させました。今回は、16個のAIツールのうち7個がディープフェイクを認識しました。

Canva.com で生成されたこの女性の画像も、Deepfake-o-Meter の一部の検出機能によってのみ AI 生成であると認識されました。
IDG
フランス企業SightengineのAI認識機能は、Deepfake-o-Meterツールよりもはるかに高速です。テストでは、写真がアップロードされてからほぼすぐに認識されました。
Canva.comで作成された女性の肖像画については、AI生成画像である確率が99%と判定されました。しかし、このプログラムは教皇の写真に関しては決定的な結果を出しませんでした。Sightengineによると、ディープフェイクである確率は53%でした。

白いダウンジャケットを着た教皇の画像の場合、Sightengine の AI はそれがディープフェイクであるかどうかを判断できません。
IDG
ディープフェイク画像をこれらの詳細で見分ける
Sightengineのようなディープフェイク検出ツールは、偽の写真を見分けるための重要なツールです。しかし、多くの場合、画像が現実を反映していないことは肉眼でも確認できます。つまり、細部にこそ真相が潜んでいるということです。
AIにとって最大の課題の一つは、人間の指の表現です。プログラムは学習中に何百万枚もの写真を見せられますが、その多くは手と指が写っています。
しかし、手は不完全な場合が多いです。例えば、握手の写真では、ほとんどの場合、3本の指しか見えません。また、指の一部がポケットに入っていたり、物に完全に、あるいは部分的に隠れている写真もあります。

このドナルド・トランプのディープフェイクは、選挙運動中にFacebookでファンによって共有されました。指の描写が間違っていますが、これはよくある問題です。また、帽子の文字は判読できません。
IDG
AIは人の指の本数がわからないため、これらの写真から指の本数と長さが変化する可能性があると推測します。それに応じて、手によっては指の数が多かったり少なかったり、あるいは長さや大きさが異なる指を付与します。
- AIプログラムは腕や脚の扱いにも苦労しており、手足が正しい位置になかったり、人に割り当てられなかったりすることがよくあります。
- 髪の毛が人工的に見えることがよくあります。髪の毛の束が間違った角度で落ちていたり、人の髪の毛だとは思えないような形になってしまったりします。
- プログラムでは、衣服の細部の再現に問題が生じることも少なくありません。シャツとコートのボタンが異なっていたり、ネックレスが閉じたリング状になっていなかったり、眼鏡のフレームが変形していたりします。
- フォントが蜘蛛の巣状の判読不能な文字として表示されます。
- 背景に間違った影があったり、比率に不一致があったりすることがよくあります。

教皇の画像では、影が眼鏡のフレームと一致しておらず、十字架は片側のみに鎖でぶら下がっています。
レディット
AIソフトウェアでディープフェイク動画を認識する
ディープフェイク動画の制作は、Open AIの動画ジェネレーター「Sora」の導入により、昨年飛躍的に進歩しました。これらの動画はあまりにもリアルで、実際の動画と見分けがつきません。YouTubeには、この新技術を使って制作された、驚くほどリアルな動画が数多く投稿されています。
無料のAI動画検出器としては、Deepware.aiとHiveのAI検出器があります。どちらもWebアプリケーションとして設計されています。Deepware.aiは完全に無料ですが、Hiveの基本バージョンでは最大20秒の動画しか受け付けません。
両方のウェブサイトにSoraの動画をいくつかアップロードし、パフォーマンスを確認しました。Deepwareの結果は残念なものでした。プログラムは、どのサンプルでもディープフェイクを認識しませんでした。
一方、Hive 検出器の結果は全く異なり、すべての Sora 映画がディープフェイクである確率が 99 パーセントであると示しました。

Hive 検出器は、ChatGPT メーカー Open AI の Sora ビデオ ジェネレーターを使用して作成された映画を AI 生成として明確に分類することができました。
IDG
AI生成テキストの認識
ChatGPTやGoogle Geminiなどのチャットボットで生成されたテキストは、一見すると人間が書いたものと区別がつきません。文法やスペルは完璧で、フィクションのテキストに事実誤認が見られることはほとんどありません。
しかし、そのスタイルを見れば一目瞭然です。チャットボットは文章を一定の長さと構成で構成する傾向があります。一方、人間は単調で退屈な読みやすさにならないよう、文章に変化と多様性を持たせることにこだわっています。
さらに、AIテキストでは、提示されている事実の例が示されていないことが多く、具体的な詳細も示されておらず、ニュアンスや考慮事項も含まれていません。
現在、インターネット上では、入力テキストを分析して AI テキストの前述の特徴を検出する AI 検出器が見つかります。
Scribbr は、英語だけでなく、フランス語、スペイン語、オランダ語、ドイツ語を理解する無料の AI 検出器です。
Isgen.aiは数十以上の言語に対応していますが、無料版はベーシックバージョンのみです。フリーミアム版では、登録後、最大50クエリで毎月最大12,000語を分析できます。

AI検出器「Scribbr」は、リクエストに応じて英語の文章を分析し、それが人工知能によって作成されたものかどうかを判定できます。ただし、このプログラムの結果には誤りがないわけではありません。
サム・シングルトン
細部までディープフェイク動画を見分ける
ディープフェイク動画には、AI生成写真と同様のエラーがしばしば見られます。テキストが判読不能だったり、細部が非論理的であったり、現実にはあり得なかったりします。例えば、影が不正確だったり、髪の毛が頭部としっかりと繋がっていないように見えたりします。
背景のデザインも映画の他の部分と調和していません。最後に、多くの場合、映画に登場する人物が周囲の人々よりも高解像度で表示されていることが目立ちます。
動画に特有の特徴もいくつかあります。例えば、動画に映っている人物は不自然なほどゆっくりと動き、まるでトランス状態にあるかのようです。
さらに、彼らの顔には無表情で、瞬きもほとんどありません。しかし、これを認識するには、映画の再生速度を落とさなければならないこともあります。
ツールと詳細を使ってディープフェイク音声を認識する
Real Time Voice Cloningなどのソフトウェアを使えば、わずか数秒の録音からディープフェイク音声を作成できるようになりました。これにより、あらゆるテキストを他人の声で読み上げることができます。
しかし、この技術はまだ完璧ではありません。様々な研究で、被験者は人工音声と本物の音声を3分の2のケースで区別することができました。しかし、その品質はすでに非常に高く、犯罪者が偽の声を使って緊急電話をかけ、人々を騙すことに成功しています。
今のところ、偽音声の検出を謳う製品は主に英語圏の国から出ています。例えば、セキュリティ企業のマカフィーは、動画や音声ファイル内の人工的に生成された音声を検出する「Deepfake Detector」を発表しました。これは、Intel Core Ultra 200Vプロセッサーを搭載したすべてのPCで利用可能です。
Resemble.aiやAI Voice Detectorなどの企業はすでに企業向けのアプリケーションを開発しています。
Hiya AI Voice Detectorも現在無料で利用できる選択肢の一つです。Chrome拡張機能として設計されており、ウェブサイト上の音声録音を分析します。実際にテストしたところ、驚くほどうまく機能しました。
Bitdefender ScamioによるSMS分析
犯罪組織は、緊急通話やSMS経由のオファーを利用して、ユーザーをウェブサイトに誘い込み、個人情報を入力させようとするケースが増えています。
セキュリティメーカーのBitdefenderは、AIツールを使用して疑わしい電子メール、リンク、テキストメッセージを分析してフィッシングやその他の犯罪的意図を検出するサービス「Scamio」を開発した。

Bitdefender Scamio はあらゆる種類のテキストを受け入れ、AI を使用してそれらを分析して、スパムやフィッシングの試みであるかどうかを調べます。
サム・シングルトン
この記事はもともと当社の姉妹誌 PC-WELT に掲載され、ドイツ語から翻訳およびローカライズされました。