Google は、聴覚障害者やオンラインで動画を検索するすべての人々が YouTube 動画をより簡単に視聴できるようにするための取り組みとして、自動動画字幕サービスを開始しました。

字幕付き動画はYouTubeにとって全く新しいものではありません。Googleは3年前に初めてユーザー生成動画の字幕作成機能を導入し、すでに数十万本の動画に字幕が付けられています。
しかし、新しい自動字幕作成サービスでは、Google Voice で使用される音声認識アルゴリズムを利用して字幕を自動的に作成します。
新しい「自動キャップ」技術を開発したソフトウェアエンジニアのケン・ハレンスタイン氏は、現時点では字幕が必ずしも完璧ではないことを認めている。
しかし、聴覚障害を持つハレンスタイン氏は、この新しい技術は今後も進化し続けると予測している。「オンライン上のユーザー生成動画コンテンツの大部分は、私のような人間にはまだアクセスできない」と彼はGoogleのブログに書いている。
当初、機械生成字幕は英語のみで生成され、13のパートナーチャンネルでのみ表示されます。しかし、ハレンスタイン氏は、機械翻訳によって字幕が

最終的には世界中の人々が 51 言語のいずれかでビデオ コンテンツにアクセスできるようになります。
「キャプションは検索性を向上させ、ユーザーが探している動画の正確な部分にジャンプすることも可能にします」とハレンスタイン氏は言う。
Google は、自動字幕作成機能のほかに、手動で字幕を作成するプロセスを容易にすることを目的とした、自動字幕タイミング (またはオートタイミング) と呼ばれる新しいサービスも開始しました。
「オートタイミング機能があれば、YouTubeで独自の字幕を作成するのに特別な専門知識は不要になります。動画内の単語をすべて記述したシンプルなテキストファイルを作成するだけで、GoogleのASRテクノロジーが単語が話されたタイミングを判別し、動画の字幕を作成します」と彼は説明します。