1枚の画像から3次元モデルを作成 驚異のfotowoosh

fotowooshというすごいサービスを見つけました。

http://www.fotowoosh.com/

通常、画像から3次元再構成(ポリゴンとかで表す立体モデルの自動生成)を行う場合、最低でも2枚の画像が必要なんですが、 このサービスはたった一枚の画像から3次元再構成をしてしまいます。

一応、画像認識に詳しく無い方のために説明しておくと、1枚の画像から奥行き情報というのを取るのは数学的に不可能で、 同じ対象を写した視点の違う画像が2枚以上あった場合に、初めてステレオ視という三角測量の原理を用いて撮影されている対象の3次元的な奥行き情報を得ることができます。

でも、このfotowooshというサービスはたった1枚の画像から3次元復元をやってしまっています。

 

人間の場合は、一枚の静止画であっても自分の持っている建物や道路などの撮影対象に関する知識を無意識のうちに使って、なんとなく写真の3次元的な構図を理解してしまいますが、実はこのサービスも人間みたいにある程度対象に対する知識を利用して、3次元復元をしています。つまり屋外の画像なら、空は上にあるはずだし、道路は下にあるはず、という知識です。そのため、対象は主に屋外の画像で、建物や道路や空やそういったものを自動的に判別して、3次元モデルを作ってしまいます。

このサービスを開発したカーネギーメロン大学のDerek Hoiemさんって、去年のCVPRっていう国際会議でBest Paper Awardを取ってましたね。僕は後でこの発表論文を読んでみたんですが、セグメンテーション技術(画像を領域分割する技術)やオブジェクト認識技術(車や人なんかを見つける技術)、そして全体の構図を用いて、統合的に画像を認識するという非常に面白いフレームワークを提案していました。

 

いやー、やっぱり世界にはすごい人がいるなあ。僕もいつかこんなスゴイサービスを作ってみたいなあ・・・。

Leave a Comment

Please note: Comment moderation is enabled and may delay your comment. There is no need to resubmit your comment.