Instagram は 3 億人を超えるユーザーを擁し、1 日に合計 7,000 万枚の新しい写真とショートビデオを投稿し、人々が関心を持つ世界中の出来事をタイムリーに伝えています。しかし、このサービスではどのようにして、まだ盛り上がりを見せている新たなトレンドを見つけ出すのでしょうか。
同社のエンジニアである Danilo Resende 氏と Udi Weinsberg 氏は、新たなトレンドを見つける同社の秘密の一部を明らかにするブログ記事を投稿しました。
同社のアルゴリズムの詳細は、大衆の集合的な関心事を活用してよりタイムリーなコンテンツを制作しようとしている他のインターネットサービスにとっても興味深いものとなるかもしれません。また、Instagram、そしておそらく他のソーシャルネットワーキングサイトがトレンドをどのように決定しているかについても、より明確な情報を提供します。Twitterと同様に、Instagramはトレンドトピックを自動的に生成します。
Instagramは写真や動画を共有するためのモバイルアプリで、ユーザーの大多数がスマートフォンで撮影したコンテンツを投稿しています。そのため、多くの人が、少なくとも写真要素のある出来事の決定的な瞬間を、その場で捉えています。

人気のイベントには複数のハッシュタグが付けられることがあります。Instagram では、ハッシュタグをグループ化する方法を考案しました。
例えば、1週間前、米国最高裁判所が同性婚を認める判決を下した際、Instagramには「#equality」というハッシュタグが付いた数千枚の新しい写真が投稿されました。その多くはワシントンの最高裁判所の階段で撮影されたものでした。ハッシュタグとは、ソーシャルメディアサービス上でコンテンツに注釈を付ける方法で、キーワードやトピックを説明する単語やフレーズの前にハッシュ記号を付けます。
トレンドとハッシュタグは、ユーザーがサービスに費やす時間を増やす上でますます重要な役割を果たしています。先週、同社は「Explore」機能を刷新し、よりトレンドのコンテンツを閲覧しやすくしました。また、検索機能も改良し、現在のトレンドをハイライト表示できるようにしました。
多くのユーザーが複数のハッシュタグを使って投稿している中で、Instagramはどのようにしてユーザーの間で話題になっている新しいトピックを見つけているのでしょうか?Instagramは、これまでに使用されたすべてのハッシュタグと、過去7日間の5分ごとの平均出現頻度をデータベースに記録しています。あるタグが突然いつもより人気になった場合、トレンドが始まっている可能性があります。
研究者らは、より複雑なニューラル ネットワーク駆動型モデルを使用して、ハッシュタグが人気ポイントに達して真のトレンドとなる時期を計算することもできるが、過去 7 日間の測定値との単純な比較でも十分に機能し、比較的軽いコンピューティング処理とメモリ要件で大きなトレンドを特定できると指摘しています。
このモデルでは、イベントが終了したときのハッシュタグの減少も考慮されています。

インスタグラム
「イベントが終わると、その時点でトレンドになっているハッシュタグを使った投稿の数は自然に減少します」と彼らは書いています。これは、イベントが終わった後も人々がその写真を見たいと考えているため、問題となる可能性があります。そこでInstagramは、イベント後数時間のトレンドを浮き彫りにする、いわゆる「半減期」機能を導入しました。
もう一つの潜在的な混乱要因は、同じイベントに複数のハッシュタグが付けられる可能性があることです。例えば、#fashionweek タグには、#model や #fashion が頻繁に追加されます。
そこで開発チームは、同じイベントに関連するハッシュタグをクラスタリングするアルゴリズムを開発しました。このアルゴリズムは、#equality と #lovewins のように、ハッシュタグがペアで使用されている頻度に注目します。また、スペルミスを検出するために非常に類似した単語も考慮し、#valentinesday と #valentineday をまとめて分類します。さらに、タグを定義済みのトピックセットに分類する内部ツールも実行します。
「トレンド分析に取り組むにあたり、このプロジェクトを、非常に具体的な機能を持つコンポーネントごとに個別に取り組める小さな問題に分割しようと試みました。その結果、チームの各メンバーは、次の問題に移る前に、一度に一つの問題に集中することができました」と研究者らは記している。