Latest evidence-based health information
Vision

MITのPicture言語は1000行のコードに相当する可能性がある

MITのPicture言語は1000行のコードに相当する可能性がある
MITのPicture言語は1000行のコードに相当する可能性がある

機械学習アルゴリズムがコンピューティングの主流になりつつある今、マサチューセッツ工科大学は、日常のプログラミングでこの技術をより簡単に使用できるようにする方法を準備している。

MITの研究者たちは6月、画像や動画内の物体をコンピュータが認識するために必要なコーディング量を大幅に削減できる新しいプログラミング言語「Picture」を発表する。これは、確率的プログラミングと呼ばれる比較的新しいプログラミング手法が、複雑なタスクに必要なコーディング量を削減できることを示すプロトタイプとなる。

新しい言語を使ったあるテストでは、研究者たちは画像認識プログラム1つで数千行に及ぶコードを50行未満にまで削減することに成功した。彼らはこの結果を6月に開催されるコンピュータビジョンとパターン認識の会議で発表する予定だ。

確率的プログラミングによって、「私たちは一般的に顔がどのように見えるかのモデルを構築し、それを使って初めて見る顔がどんなものであるかについてかなり正確に推測します」と、この研究に協力したMITの計算認知科学教授、ジョシュ・テネンバウム氏は述べた。

mit picture マサチューセッツ工科大学

MIT の確率的プログラミングに関する新たな研究により、コンピューターは推論を通じて顔を認識できるようになりました。

新たな展開

Picture言語は統計的推論を用いて、コンピュータビジョンに必要な基本的な計算作業の多くを削減します。これはコンピュータアニメーションの逆の動作とほぼ同様です。ピクサーなどのアニメーション会社が使用するコンピュータグラフィックスプログラムは、プログラマーからの比較的少量の指示で、3次元オブジェクトを2次元で表現します。Picture言語は逆の動作をします。2次元画像内のオブジェクトを、そのオブジェクトが何であるかを示す一連のモデルと比較することで認識します。

この研究は、機械学習の利用をさらに促進するための確率的プログラミング言語を開発するために米国防高等研究計画局が2013年に開始したプログラムから生まれたものである。

機械学習は数十年にわたる学術的な研究でしたが、より強力なコンピューターと、Amazon Web Services および Microsoft Azure が提供する新しいクラウド機械学習サービスのおかげで、急速に商業利用に適した技術になりつつあります。

確率的プログラミングは機械学習を必要としないが、機械学習の使用を効率化する方法を提供できるとテネンバウム氏は述べた。

「純粋な機械学習では、ただデータをどんどん集め、機械学習に仕事を任せるだけでパフォーマンスが向上します」とテネンバウム氏は述べた。一方、確率的プログラミングでは、「基盤となるシステムはより知識ベースであり、画像がどのように形成されるかという因果プロセスを利用しています」とテネンバウム氏は述べた。

Pictureは、MITが現在開発中の様々な確率的プログラミング言語の一つです。同チームが開発した、より汎用性の高い確率的プログラミング言語「Venture」は、他の種類の問題の解決にも使用できるとテネンバウム氏は述べています。

Otpoo

Health writer and researcher with expertise in evidence-based medicine and healthcare information.