機械学習を用いれば、写真が「撮影する前」からプロ仕様の美しさに──グーグルとMITがアルゴリズムを開発

MIT-Instant-Retouch-TA-12db540ca97a6020f2db78ca5b27647ac89d2f28

マサチューセッツ工科大学(MIT)とグーグルの研究者たちが、写真を「プロの写真家」が撮ったように瞬時に自動補正できるアルゴリズムを発表した。機械学習によって「よい写真」の条件を導き出し、高解像度なデータであっても最適な補正がほぼリアルタイムにできるという。その仕組みと実力とは。

TEXT BY ELIZABETH STINSON

WIRED(US)

image

IMAGE COURTESY OF MIT

「インスタ映え」写真を撮ることと、写真を編集することは別物である。ほとんどの人はただ写真をアップロードし、フィルターをタップし、彩度を微調整して投稿するだけだ。Instagramで瞬時に満足感が得られる「Reyes」のようなフィルターを使わずに写真をよく見せたいなら、プロに協力してもらうのがいい。または、本当に高性能なアルゴリズムに頼るしかない。

マサチューセッツ工科大学(MIT)とグーグルの研究者たちは最近、プロの写真家のように写真を自動で補正できる機械学習のアルゴリズムを発表した。これは写真を撮るときに、どうしたらよりよく見えるかをニューラルネットワークが正確に特定するアルゴリズムである。「コントラストをわずかに上げる」「明るさを抑える」といったあらゆる補正が可能で、しかもこれらの変更を0.02秒以下で適用するのだ。

「1秒間に50回の補正が可能です」と、MITの博士課程の学生であるマイケル・ガルビは説明する。彼は、このアルゴリズムに関する論文の主執筆者である。ガルビのアルゴリズムは写真を瞬時に補正し、カメラのシャッターを切る前から、“補正済みのヴァージョン”を画面やヴューファインダー上で示してくれる。

ニューラルネットワークによる学習の効果

ガルビは2016年から、ニューラルネットワークがどのように個別の写真スタイルを再現できるようになるかの研究を、グーグルの研究者たちと共同で始めた。この研究は、2015年にドイツの研究者たちがヴァン・ゴッホやピカソのような画家のスタイルを模倣できるニューラルネットワークをつくった研究分析にならっている。これは編集アプリを開くことなく、より簡単にプロ級の画像をつくり出そうという発想である、とガルビは言う。

ここでアルゴリズムを、より「ニュアンス」を意識した自動フィルターとして考えてみよう。一般的なフィルターは必要かどうかに関わらず、画像全体に一律に補正を適用する。これに対してガルビのアルゴリズムは、最適な補正を必要な箇所にピンポイントで適用できるのだ。「一般的には画像のすべてのピクセルが同じように一括変換されます。特定の領域だけ修正できるようになれば、もっと興味深い結果になるでしょう」とガルビは言う。

このアルゴリズムはニューラルネットワークによる学習の効果で、状況に応じた適切なフィルターを必要な部位だけにかけてくれる。例えば日当たりのよい背景でセルフィーを撮ると、自動で顔だけ明るくしてくれる。ネットワークが風景写真であると認識すれば、水の彩度を上げたり、木々の緑色を増したりできるだろう。ガルビのアルゴリズムは、手動で補正した画像を使って学習させたことで、このような“視覚のニュアンス”を再現できる。

研究者たちは、プロの手で編集された写真をニューラルネットワークに5,000枚以上も取り込み、それらを「よい写真」であると学習させた。同じ要領で、ニューラルネットワークにあなたが編集した写真を入力したら、いずれあなた個人の写真スタイルを再現できるようになるかもしれない。

低解像度で補正することで処理を高速化

それだけでも、このアルゴリズムはかなりすごい。しかし本当の成果は、ガルビと彼の研究者仲間が、このソフトウェアを携帯電話で実行できるくらい軽い容量でつくったことだ。ガルビは「速くてリアルタイムに実行する鍵は、画像のすべてのピクセルを処理しないことです」と言う。

どんな写真であっても何百万ものピクセルを一律で分析する代わりに、ガルビのアルゴリズムはその写真の低解像度ヴァージョンを処理することで、どの部分を修正するか決める。アルゴリズムは色や明度、彩度、それらの要素をどのように調整するか、ニューラルネットワークで構築したルールに基づいて予測する。

そのうえで、高解像度な元の画像に補正を加える。フルサイズの画像を常時処理するわけではないので、携帯電話の処理能力の実力以上に「重い」処理ができるわけだ。

一連の自動編集機能は研究段階に留まるが、既存のカメラの機能をより高速にできるであろう。このアルゴリズムはガルビいわく、HDR撮影した高解像度の写真であっても、ほぼ瞬時に処理できるようになるという。これは順当な進化のように見えるが、グーグルが興味をもつには十分なレヴェルの技術である。

ガルビはこのテクノロジーが、将来のAndroidに搭載されるかどうかについてはコメントしないだろう。しかし、われわれが撮る写真のためにも、そうなることを期待しよう。

  • このエントリーをはてなブックマークに追加

関連記事

話題をチェック

  1. 600x601x20170822nana.jpg.pagespeed.ic.u5ed1iTQeL-e5b3de5c391c8e3805df72a8cdb3da051ece71fa

    ANA、機内食総選挙2017の結果発表 和食は牛すきやき丼、洋食はビーフシチューとオムライス

    Sponsored link  機上ӗ…
  2. MIT-Instant-Retouch-TA-12db540ca97a6020f2db78ca5b27647ac89d2f28

    機械学習を用いれば、写真が「撮影する前」からプロ仕様の美しさに──グーグルとMITがアルゴリズムを開発

    NEWS 2017.08.22 TUE 08:00マサチ&…
  3. GettyImages-496380034-e1503241697905-b18cea347ee2933a806af5a4adfa2f3d9569add1

    「世界共通のインターネット」を巡る、グーグルとカナダ最高裁との闘い

    NEWS 2017.08.21 MON 07:00カナダ&…
ページ上部へ戻る