この間出した論文誌への投稿、査読結果が戻ってきました。(査読というのは、論文誌に載せるかどうかの判断のためのレビューのこと)
結果は、C判定。つまり、色々修正とか問題点とか指摘されて、その回答如何で掲載するかどうか決めるというもの。
覚悟はしてたけど、なかなか厳しい結果・・・。
とりあえず、先生とも打ち合わせて大まかな方針が決まったので、これからまた頑張ります・・・。
この間出した論文誌への投稿、査読結果が戻ってきました。(査読というのは、論文誌に載せるかどうかの判断のためのレビューのこと)
結果は、C判定。つまり、色々修正とか問題点とか指摘されて、その回答如何で掲載するかどうか決めるというもの。
覚悟はしてたけど、なかなか厳しい結果・・・。
とりあえず、先生とも打ち合わせて大まかな方針が決まったので、これからまた頑張ります・・・。
5月に開催されるMVA(Machine Vision Applications)という国際学会に投稿すべく、先週末は執筆活動をしていたんですが、いざ投稿と思って見てみたら、11月7日だった締め切りがいつのまにか一ヶ月先に延びてました・・・。
ま、早めに仕事片付けたと思えばいいんですけど・・・。なんか落ち着かないな。
Conferenceは昨日までで終了で、今日から二日間はWorkshopが開かれます。
ちなみに、僕はWorkshopの一日目だけ参加する予定。
Workshopは4つのプログラムが並行して開かれており、僕はそのうち今回の学会参加最大の目的の一つ“PASCAL Visual Object Class Challenge 2008″ を見学してきました。
PASCALチャレンジは、オブジェクト認識に関して、同様の条件のもとで複数の手法を比べるコンテストで、全部で3部構成になっています。
1. オブジェクトカテゴリ認識
画像の中に映っているオブジェクトのカテゴリを判別する。(車、人、バイク、etc)
2. オブジェクト位置検出
画像の中に映っているオブジェクトの位置を検出する。(オブジェクトを囲む長方形として)
3. オブジェクトセグメンテーション
画像中のオブジェクトが移っている領域を正確にラベルづけする。
この3つの分野について、エントリーした手法が認識率を競います。対象はFilckrからひっぱてきた画像50万枚、20カテゴリのオブジェクトに対して行われます。

試験画像の例
それぞれのパートでは、測定条件等々について説明した後、加来手法の認識率や結果画像を示し、それぞれ上位2つの認識手法について説明をする、という流れでした。
結果などはいずれサイト上にアップされるそうですが、
1. オブジェクトカテゴリ
1位: サリー大学
2位: カーネギーメロン大学
2. オブジェクト位置
1位: INRIA(フランス国立情報学自動制御研究)
2位: シカゴ大学
3. オブジェクトセグメンテーション
1位: ゼロックス
2位: オクスフォード・ブルックス大学
でした。商品は記念Tシャツ(笑)。
印象としては、やはりBags of words(オブジェクトカテゴリ認識でメジャーな手法)をベースにするものが多いんですが、情報量を上げるために、色を使うものや、画像中のコンテクストを使うもの、認識を段階的に行うものなど、結構複雑なプロセスを踏むものが多かった気がします。Bags of wordsベースの手法は、もうかなり応用が進んでしまってるんだなあ、と思いました。
——————————-
というわけで、これにて僕のECCVの報告は終了。
先日、論文誌に一本目を投稿して、これから研究を更に改良しようというタイミングでこの学会に参加できた意義は大変大きかったです。世界中のすぐれた研究を見ることができて、色々と刺激とヒントをもらいました。
今度は、自分が発表する立場で参加したいなー、と思います。
4日目と5日目はそれぞれ、
および
のセッションがありました。段々自分の得意分野から外れてきたので、なかなか理解するのが大変です。
以下、個人的に面白いと思ったもの。
“SIFT Flow: Dense Correspondence across Different Scenes”
Ce Liu, Jenny Yuen, Antonio Torralba, Josef Sivic, and William T. Freeman
動画像などで、映像の動きを推定するのに用いられているOptical Flowという手法を元に、似たようなカテゴリの画像に対してその変化分を推定するSIFT Flowと呼ばれる手法の提案。
“What Is a Good Image Segment? A Unified Approach to Segment Extraction”
Shai Bagon, Oren Boiman, and Michal Irani
セグメンテーションの方法として、カラーやテクスチャなど色々な切り口があるが、それらを統一的に扱えるセグメンテーション手法の提案。
“Priors for Large Photo Collections and What They Reveal about Cameras”
Sujit Kuthirummal, Aseem Agarwala, Dan B Goldman, and Shree K. Nayar
Flickrなど、インターネット上に大量にある画像を利用して、カメラ毎の特性を、特定の撮影環境などの制約を設けることなく、統計的に求める手法を提案。(同じようなアプローチで、素人がとった写真か、玄人がとった写真家もわかる)
ちなみに、このうち1番目と3番目はAdobe Systemとの共同研究です。Adobeとマイクロソフトは、ECCVでも目立ってた気がします。
今日も一日参加してきました。
ここ数日情報量が多すぎて、頭が沸騰中です。
これは英語力の問題なのか、はたまた基礎知識の問題なのか・・・。
今日のセッションはPeople、Face、Tracking、それからポスターセッションでした。そのうち個人的に興味持ったやつをいくつか紹介しますと、
The Naked Truth: Estimating Body Shap Under Clothing
Alexandru O. Blan and Michael J. Black
X線を使わずに、服の上からその人の体型を推定するという研究。人の体型とポーズをパラメータ化した3Dモデルを、画像に対してあてはめていくというアプローチをとってました。
Face Alignment Via Component-Based Discriminative Search
Lin Liang, Rong Xiao, Fang Wen, and Jian Sun
顔の特徴点(眼尻や口の端点など)で、間違った物に関して追加で学習させる(どの方向にずれたのか教える)ことで、かなり難しいポーズや、光環境でも特徴点を正確にとれるように改善した研究。
Robust Real-Time Visual Tracking Using Pixel-Wise Posteriors
Charles Bibby and Ian Reid
単純なモデルでオブジェクトを高速かつロバストにトラッキングする研究。とにかく結果がすごかった。動画見つけたら後ほどアップします。
Multiple Component Learning for Object Detection
Piotr Dollar, Boris Babenko, Serge Belongie, Pietro Perona, and Zhuowen Tu
画像の中からオブジェクトを検出するのに、パーツという考え方を導入して行っていた。つまり歩行者であれば、足とか頭などの検出機を作って、それを元に全体を推定するという方法。(ポスターセッション)
他にも、ISMAR07でBest Paperをとった、マーカレス&リアルタイムAR技術の改良版(高速なカメラ移動に強くなった)もTrackingのセッションで発表されてました。明日デモコーナーで実際動くものを展示するそうなので楽しみです。
さてさて、今日の学会が終わって僕は昨日予約した新しいホテルへ移動しました。が、
割り当てられたのは、ホテルのオーナーが所有しているアパートの一室。そういや、電話でアパートなら空いてるって言ってたっけ。てっきり、アパートと言いながらも、ちょっとグレードの高い部屋だろうくらいに考えてました。
正直広すぎて落ち着かない・・・。ホテルの部屋に空きが出たら、移れないかどうか明日交渉してみます。
とりあえず、電話しまくった結果、今朝無事次のホテルが決まりました。値段はちょっと高くなっちゃいましたが背に腹は代えられない。今のホテルは、町の中心から離れて地下鉄も届かない不便なところで、ご飯もあまりおいしくないので、予約ミスも結果オーライということで。
さて、そんなこんなで今日からECCVの発表です。今日は、今回の出張の目的の一つ”Recognition”のセッションが午前中に行われるので、楽しみにしてました。
さて、午前中のセッションが始まる前に各種Awardの発表がありました。(僕の印象ではこの発表って、最後の方にやるもんと思ってたんですが)
今回、Best Paperに輝いたのは、ドイツのマックスプランク研究所のBlaschkoらによる”Learning to Localize Objects with Structured Output Regression”という研究に与えられました。
あれ?この人たち今年のCVPR(6月に開かれた国際学会)でもBest Paperとってなかったっけ?
と思ったら案の定そうでした。CVPRのものとは違うアプローチで、もっと精度の良いものを作ってきたらしい。
そして、Best Student Paperはスタンフォード大のHeitzらの”Learning Spatial Context: Using Stuff to Find Thnigs”でした。
両方とも”Recognition”のセッションからのもので、自分の研究テーマ(オブジェクトカテゴリ認識)と関係の深い「オブジェクト検出」に関するものでした。
そういえば、最近はオブジェクトカテゴリ認識よりも、その位置を特定する研究の割合が増えてきた気がするんですが、そういう流行あるのかな?
というわけで、午前中にはこれら2つの研究も含めて、全部で4つの発表が行われました。Best paperのものは、従来「検出窓」みたいなもので画像中をスキャンして、オブジェクトを検出していたのを、「Structured Output SVM」という手法を使って、画像全体から正確に検出できるようにしたというもの。Student Best Paperは背景などオブジェクトの周辺情報(コンテクスト)をうまく使ってオブジェクトを検出しようという研究でした。他にも画像アノテーション(タグ付した画像からの最適な画像検索)に関するものや、車載カメラの動画像から画像のセグメンテーションと認識を高速に行うというアプローチが発表され、どれも興味深く聞かせてもらいました。
午後の前半は、ポスターセッションということで、自分の研究テーマに関係ありそうなものをいくつか見てまわり、午後の後半は”Stereo”のセッションに参加して、車載カメラからリアルタイムで道路環境の3次元情報を取得する話や、マルチカメラからの3次元復元の話などなどを聞いてきました。
とりあえず、2日目の発表はこれで終了で、その後は”Reception”ということで、場所を移して立食パーティーみたいなものが行われました。といっても料理は少なく、立ち飲みがメインで、何かプログラムがあるわけでもなく、研究者たちが延々と立ち話をしているような感じでした。
一人で来ている自分としては特に話し相手もなく、ちょっと面識がある東大の佐藤先生や、僕が一方的に知っているだけの池内先生に無理やり話しかけたくらいで、早々に退散してきました。
というわけで、本日の感想としては、自分の研究分野まわりってやっぱり盛り上がってるな~ってこと。これを100%の時間使って研究している、頭の良い研究者とまともに争ったら、半端な僕には勝ち目がないな(笑)
社会人ドクターの僕としては、こういう天才の成果をうまく組み合わせ、以下にアカデミックと実用の間をつなぐような研究をするかが、自分の立ち位置だと思っています。
とりあえず、猛烈に自分の研究を進めたくなりました。
現在、ECCV 2008というコンピュータビジョンの学会に参加するため、フランスのマルセイユに来ています。今回、僕は特に発表はしないのですが、高いレベルの研究が発表される場なので、色々と情報を仕入れてやろうと思っています。
マルセイユの気候は、東京と同じか、若干暖かいくらいでしょうか。
ちなみに、マルセイユのホテルはインターネット経由で予約したのですが、ついて早々誤って2009年で予約を入れる大ポカをやっていたことが判明しました。
とりあえず14日の朝までは予約を確保したのですが、それ以降は宿なし状態です。色々と他のホテルへ連絡してみたのですが、やはりどこも既に埋まってました。
今は、泊っている宿のキャンセルを待ちつつ、他を探し回っているところです。(汗)
というハプニングはありつつも、まずは初日チュートリアルに参加してきました。
チュートリアルというのは、学会開催前に各分野の権威のある先生を呼んで、その分野について概説してもらうというもので、最先端の研究を俯瞰するのに非常に便利な講座です。
チュートリアルは午前と午後の部に分かれており、それぞれ4つのコースが並行で4つの部屋にわかれて行われました。
色々と興味のあるテーマが多く、色々迷ったのですが、自分の研究テーマに直結するところとして、午前中は”Supervised Learning for computer vision: Theory and algorithms”、午後は”Biological Vision : A Source of Insights for Computer Science”に参加することにしました。
午前中の講座は、いわゆるコンピュータに何かを覚えさせる「機械学習」と呼ばれる方法についての講義で、午後は脳に関する研究からコンピュータビジョンにアプローチするという内容でした。
難しくてついていけないところもありましたが、どちらも自分の研究のヒントを得ることができました。
というわけで、明日からの発表が楽しみです。
ご無沙汰してます。10月の頭に入って少し忙しさも落ち着いたので、9月におこったもろもろについて、ご報告させていただきたいともいます。
1.技術評論社連載終了
途中、学会発表やら何やらで大分時間が空いてしまいましたが、無事連載が終了いたしました。
連載を持つというのがそもそも初めてのことだったので、貴重な経験ができました。この機会を与えてくれた技術評論社の方、背中を押してくれたジェイマジックや友人の皆様、そして読者の皆さんに感謝したいと思います。
2.後期の授業開始
9月25日から、大学も後期の授業が始まりました。せっかく学費を払っているので、僕も(博士課程は特に授業を取る必要はないのですが)応用統計解析という授業を一つとりました。内容的には僕の研究分野との係わりも大きいので、楽しみにしてます。さてさて、ちゃんと授業についていけるかな・・・?
社会人になると数学を勉強する機会というのはなかなかとれないので、この機会を有効に使いたいと思います。
3.電気学会論文誌への投稿
昨日はじめて論文誌へ自分の研究を投稿いたしました。本当にぎりぎりまで、必死に実験してました。
博士号取得までには論文誌に最低2本が掲載されなければいけないのですが、そのための貴重な一本です。この後、査読にまわされて掲載の可否が判定されます。頼むからのってくれ~!
以上が、近況です。これから某国際学会への発表を準備しつつ、自分の研究をもっと発展させていこうと思ってます。
昨日、HIP/CVIM/PRMU合同研究会@慶應大学で研究発表してきました。
アカデミックなプレゼンをしたのは約10年前の修論発表以来なので、とても緊張しました。
評判は良かったのか悪かったのかはよくわからずですが、とりあえず無事終わってほっとしてます。
今度は今月末に控えている論文誌への投稿があります。今度こそ実験データをもっと作らないと。昨日の発表では主にそこを突っ込まれたので。
自分の発表以外では、1日目に行われたカーネル法に関するチュートリアルがとても面白かったです。今後の参考にさせてもらいます。
なんとか、9月の学会の原稿を提出しました。
論文を書いたのって、修士論文以来でだったので、正直しんどかった・・・。
これから発表までの間にプレゼン資料をまとめたり、追加の実験やったり、デモを作ったりする予定です。
今後、他にもたくさん学会や論文誌に投稿しなくちゃいけないことを考えると、研究時間の中のうちかなりの割合が論文作成などに使われることになりそうです。
でも、まだまだ今の研究は改良したいところがあるので、バランスとってやりたいと思います。