社長の宮田から薦められて、下のサイトで話題になっているGoogleの論文を、さっと目を通してみました。
Google、次世代画像検索を実験中―画像にページランク導入へ
ご存知の方も多いと思いますが、GoogleではPageRankという技術を用いて、Webページに関して最適な検索結果を提供しようとしています。PageRankというのは
- 他からリンクされているWebページほど重要なページ
- 重要なページからリンクされているページもやっぱり重要
という原則を用いて、Webページにランクを付け、そのランクに基づいて検索結果を表示させる技術です。
今回、GoogleはこのPageRankの仕組みをGoogle Image Searchに導入する方法を北京で開かれたWWW Conference 2008で発表しました。
Webページでは、ページ間のリンクをHyperLinkでそのまま表すことができましたが、画像にPageRankの仕組みを導入する場合、どのように画像間のリンクを表すかが問題となります。
今回の発表者であるジョージア工科大の学生とGoogleの研究者は、画像間の類似度をリンクに見立てることで、これを実現しました。
画像間の類似度の取り方は、画像の部分部分の特徴(局所特徴)を見てやって、似ているパーツが他の画像にどれだけあるかという数で決めているようです。
例えばモナリザの絵を考えてみましょう。インターネット上にはモナリザのパロディ画像などもたくさん転がっていると思いますが、これらはすべて元のモナリザの画像を改変したものなので、モナリザの原型に近いネット上の画像にたくさんリンクが貼られることになり、従ってPageRankが上ります。そのため「モナリザ」という語で検索すると、モナリザの元画像が上位にひっかかりやすくなります。
画像認識技術的には仕組みとして非常にシンプルですが、この簡単な仕組みでインターネット上にある大量の画像に適切にアクセスできるようになることのメリットは大きいでしょう。
ちなみに、今度の6月にアラスカで開催されるCVPR2008というコンピュータビジョンの大きな学会の採録研究一覧が発表されたのですが、その中の口頭発表のセッションで同じくPageRankを使ったとても面白い論文がありました。
Unsupervised Modeling of Object Categories Using Link Analysis Techniques
というタイトルのカーネギーメロン大の論文なのですが、これはページランクの仕組みを用いて学習画像から自動的にカテゴリ毎のオブジェクトのモデルを生成する、というものです。平たく言えば例えば車の画像をたくさんコンピュータに学習させれば、自動的に例えばタイヤや窓のような形状を持つのが車だよ~、みたいなことを学んでくれるというものです。(かなり乱暴な説明ですが)
たまたまPageRankというWeb検索の仕組みを画像へ適用した論文を続けて読む機会がありましたが、こういう違う分野の技術が画像の分野に適用されるのを見るのは面白いです。