Latest evidence-based health information
Vision

Google: 画像検索で画期的な進歩を遂げました

Google: 画像検索で画期的な進歩を遂げました
Google: 画像検索で画期的な進歩を遂げました
Google: 画像検索で画期的な進歩を遂げました

人間はパターン認識に優れているかもしれませんが、コンピュータは画像の識別があまり得意ではありません。人間の脳は自由の女神像や万里の長城といった有名なランドマークの写真をすぐに認識できますが、コンピュータはテキストタグのようなカンニングペーパーがなければ、たいていの場合、何の手がかりも得られません。

しかし、Googleの「コンピュータービジョン」研究プロジェクトが成功すれば、状況は一変するかもしれない。検索大手のGoogleは月曜日、マイアミで開催されたコンピュータービジョンとパターン認識(CVPR)カンファレンスで、ランドマーク認識に関する論文を発表した。Googleによると、この新技術により、コンピューターは世界中の5万以上のランドマークの画像を80%の精度で迅速に識別できるという。

Googleは、自社のパターン認識技術はまだ研究段階であり、新しいサービスではないことを明言しています。10回中8回しか正解しない検索ツールでは、本格的な運用には至っていないため、それも当然と言えるでしょう。とはいえ、このコンセプトは非常に魅力的で、Googleが将来的に精度を向上させることができれば、旅行者にとって大きなメリットとなるでしょう。未確認のランドマークを写真に撮れば、スマートフォンやインターネット対応カメラが即座にそれを認識する機能は、きっと人気が出るでしょう。もちろん、まだ誰も考えていないような、科学分野や消費者向けアプリケーションへの応用も期待できます。

では、どのように機能するのでしょうか?Googleのコンピュータービジョン研究責任者であるジェイ・ヤグニック氏がブログ記事で説明しています。最初のステップは、Googleの2つのサービス(PicasaとPanoramio)とオンラインのツアーガイドのウェブページから、GPSタグ付きの4000万枚の写真とランドマークのリストを作成することです。「次に、これらの情報源とGoogle画像検索を使用して、各ランドマークの候補画像を見つけ、効率的な画像マッチングと教師なしクラスタリング技術を用いて「枝刈り」を行いました」とヤグニック氏は書いています。

最終段階は、高速画像認識のためのインデックスシステムの開発でした。しかし、このプロジェクトの巧妙さにもかかわらず、正確な画像検索は依然として困難です。下の写真が示すように、無関係なランドマークが類似した建築的特徴を共有している場合があり、また、巨大な旗やバナーが含まれていると、誤認識につながる可能性があります。

Googleの研究プロジェクトによって、現在の画像検索はタグ付けに依存しすぎているため、改善されることを期待したい。次のステップは、ランドマークではない無数の画像を識別する方法を見つけることだが、その作業ははるかに困難に思える。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.