6 月 27

ここのところ、仕事が徐々に落ち着き始めたため、大学の方へも通えるようになってきました。(ジェイマジックの皆さんに気を使ってもらってるお陰です。ありがとう!)

いやー、やっぱり大学は良いですね。
何が良いって、まず食事が安い!職場のある麻布十番だとお昼が千円近くするのに、学食なら半分の金額ですから(味は確かに麻布十番の方が良いですが)。
しかも駅前も学生の街だから安い定食屋が多いですし、昔食べた定食メニューを食べて思わず懐かしさがこみ上げてきたり・・・。

それからドクターコースの人には机が割り当てられてるんですが、ここも静かで良い!雑音が少なく、自分のペースで仕事や勉強ができます。職場はエアコンが効きすぎていて、やや寒いくらいですが、ここは温度も快適です。
じっくり考えたいことがある時なんかはいいですね。(惜しむらくは、このドクタースペースが来年から別の目的に割り当てられるらしく、1年で追い出されてしまうことですが・・・)

 

さて、今日は学部4年生の「第3回英語輪講」という研究室の行事に参加してきました。輪講と言うのは、論文誌等から4年生が論文を1本選んで、その内容をあたかも自分が研究したかのようにプレゼンテーションするというイベントで、英語輪講と言うのは特に英語で書かれた論文を対象とします。当然のことながらその論文を深く読み込まなければいけないため、4年生にとっては大変勉強になる行事です。

聴講する側としては、4年生が手っ取り早くそういう最新(?)研究を噛み砕いてプレゼンしてくれるわけですがら、こちらも勉強になって非常にありがたい話です。と、ここで終われば個人的には万々歳なんですが・・・。

当然、この手のプレゼンの後には「質疑応答」なるものがあります。昔はうちの研究室には教授が2-3名、それにポスドク/講師の方もいたので、僕が何か学生に質問するような必要はほとんど無かったんですが、今は教授は斎藤先生一人でポスドクの方もいないので、ドクターにもそのお鉢が廻ってくるようになりました。中でもおそらく僕は最年長ですから、当然色々と鋭い質問をすることが期待されるわけです。

そうなると、いい加減な態度では発表を聞けません。なんとか内容を理解しようと必死です。わからないことはこっそりGoogleで調べたり、どこまでが一般常識でどこからがそうでないのかも判断がなかなか付かず、「うーーん、こんなトンチンカンな質問してよいのだろうか・・・」と恐る恐る質問をしてたりします。

 

そのうち、ざーっと流して聞いてもすんなり内容を理解できるようになったりするんだろうか?今はその時良くわからなかった基礎理論などを後でこっそり勉強しなおしたりしています。

6 月 25

このブログでは、政治の話はしないようにと思ってたんですが・・・。

法律学者ローレンス・レッシグのブログにこんなエントリーが出ていました。
「必読:これからの10年」

レッシグはサイバー法に関する第一人者で、インターネットがもたらした社会的変化によって生じた法律や民主主義上の問題を記した「CODE」をはじめ、インターネット時代の著作権問題について記述した「コモンズ」、「Free Culture」などの優れた著作を残しています。(実は今、ようやく積読していた「Free Culture」を読んでいる最中なんです。)
特にここしばらくは、現代の著作権期間の延長などの著作権強化の政策が、社会全体の文化的なイノベーションを阻害しているという立場から、研究だけでなくクリエイティブ・コモンズを組織するなど社会的な活動を行ってきました。

そのレッシグが、ネットワークの問題から別のテーマへ重心を移すそうです。
レッシグが今後取り組みたいと言うテーマは、政治の腐敗という、昔から再三繰り返されてきたテーマです。これはレッシグ自身も実際に著作権強化の反対活動などを通して直面してきた問題で、例えば彼はRIAAというアメリカ合衆国のレコード会社の業界団体や、ハリウッド、ディズニーなどのロビイストの活動が政治に大きく関与してきたのを目の当たりにしてきました。これは贈収賄だけの問題ではなく、合法的な政治献金も含まれます。(ちなみにレッシグは別に著作権に反対しているわけではありません。ただ今の著作権「強化」の政策が、これら古いコンテンツ産業を保護するためのもので、新しいクリエイティビティや産業の芽を摘み、総じて社会全体にとってはマイナスの影響を与えるバランスを欠いたものだということを問題視しています。)

これは昔から民主主義/資本主義が抱えてきた大きな問題で、力のある企業が自分達の現在のマーケットの優位性を守るためになんらかのロビー活動を行って、政策に影響を与えるのは良くあることだし、法律に触れなければ企業にとっては十分に合理的な行動です。 

この問題は、僕自身も著作権問題だけでなく、イラク問題や日本の公共事業の問題などを見るにつけ、常に考えていたことなので、レッシグのような優れた学者がこの分野に挑むということを非常に嬉しく思っています。

本人は、この分野では自分がまだまだ初心者だと言っています。しかも

「幻想は抱いていない。10年が経過しても、この問題がまだ存在していることは99.9%確信している。だが、失敗の確実性はときに挑戦の理由となる。この場合にもそれはあてはまる。」

とある通り、かなり困難な道なのを承知しています。それでも現実の問題を直視してきた結果、それにあえて取り組みたいというレッシグの姿勢はすばらしいです。

レッシグが認める通りこの分野で大きな進展が生まれるとは考えづらいですが、それでもまた彼が「CODE」の時のように僕の目からウロコを落としてくれることを期待しています。



6 月 22

fotowooshというすごいサービスを見つけました。

http://www.fotowoosh.com/

通常、画像から3次元再構成(ポリゴンとかで表す立体モデルの自動生成)を行う場合、最低でも2枚の画像が必要なんですが、 このサービスはたった一枚の画像から3次元再構成をしてしまいます。

一応、画像認識に詳しく無い方のために説明しておくと、1枚の画像から奥行き情報というのを取るのは数学的に不可能で、 同じ対象を写した視点の違う画像が2枚以上あった場合に、初めてステレオ視という三角測量の原理を用いて撮影されている対象の3次元的な奥行き情報を得ることができます。

でも、このfotowooshというサービスはたった1枚の画像から3次元復元をやってしまっています。

 

人間の場合は、一枚の静止画であっても自分の持っている建物や道路などの撮影対象に関する知識を無意識のうちに使って、なんとなく写真の3次元的な構図を理解してしまいますが、実はこのサービスも人間みたいにある程度対象に対する知識を利用して、3次元復元をしています。つまり屋外の画像なら、空は上にあるはずだし、道路は下にあるはず、という知識です。そのため、対象は主に屋外の画像で、建物や道路や空やそういったものを自動的に判別して、3次元モデルを作ってしまいます。

このサービスを開発したカーネギーメロン大学のDerek Hoiemさんって、去年のCVPRっていう国際会議でBest Paper Awardを取ってましたね。僕は後でこの発表論文を読んでみたんですが、セグメンテーション技術(画像を領域分割する技術)やオブジェクト認識技術(車や人なんかを見つける技術)、そして全体の構図を用いて、統合的に画像を認識するという非常に面白いフレームワークを提案していました。

 

いやー、やっぱり世界にはすごい人がいるなあ。僕もいつかこんなスゴイサービスを作ってみたいなあ・・・。

6 月 20

既にWeb2.0ブームというのは落ち着いて定着してきた感がありますが、今のドコモ2.0とか、少し前だと楽天2.0とか、やっぱり相変わらず「2.0」というのは流行しているみたいですね。

と思っていたら、ひろゆき氏がITmediaのインタビューでこんなこと言ってます。

「Web2.0は大嫌い」とひろゆき氏 ニコ動有料版で「もっと面白くしたい」

僕もこのWeb2.0っていうのがそこまで騒ぎ立てるほど真新しいものかな、という気がしてならなかったので、この記事の中の
「Web2.0とは技術革新でも新しいビジネスチャンスでもなく、人間本位の仮想社会をとりもどすいわばWebルネサンスとでもいうべきもの」
という指摘には頷くものがあります。(「お金を稼ぎたい人たちが人をだますための用語として使われているような気がしていて」にも思わず共感(笑))

例えばWeb2.0の中にくくられる技術としてはAjaxやブログ(特にRSS)といった技術があるけど、これなんて昔からあるHTTP、XML、JavaScriptを使っているだけで、とりたてて新しいわけではないです。

Web2.0で騒がれるもうひとつは、サービスの形態です。例えばSNSやブログ、YouTube、WikipediaなんかかはCGM(Consumer Generated Media)と呼ばれていて、今までは企業がコンテンツをつくって発信していたものが、ユーザに自由にコンテンツを作らせることで、ユーザが集まれば集まるほどサイトの価値が上がるようになっています。

でもこれもハッカーがオープンソースとかの開発で昔からやってたことのような気がします。今までこういう試みが技術の層だけだったのがサービスの層にまで出てきたという点が新しいですが。

結局のところ、Web2.0全体に流れる技術であれ思想であれ、昔からインターネットの根底に流れていた思想がより具現化してきたことにすぎないんじゃないかと思うんです。

例えば、インターネットが世に出てきた当初に宣伝されていた文句としては、こんなのがあります。

  1. オープンでフラットなネットワーク。
  2. 人種や国境を越えて誰でも参加可能。
  3. 巨大企業や国家がコントロールできない
  4. 個人が情報発信することで、巨大メディアに負けない力を持てる。
  5. ボランティア、人の善意によって作られたネットワーク

やや、こういうアナーキーな感じに憧れて、僕はこの業界に入りました(笑)。

それと、インターネットの世界における技術発展は、ハッカーのボランティアによるところが大きいですが、ハッカーのモノ作りの方法論としては、例えばこんなのがあります。

  1. 一からコード書くのも良いけど、使いまわせるものは使いまわそう。
  2. 書いたコードは公開してしまおう。
  3. 書いたコードを早めに、頻繁にリリースすることで、ユーザからのフィードバックをもらおう。
  4. たとえバグのある状態でリリースしてしまっても、ユーザの数が十分多いなら誰か治し方を知っている。

ほら、結局これってWeb2.0の特徴と呼ばれているものに一致するように見えませんか?(ちなみにこのオープンソースの開発手法をより知りたい方はエリック・レイモンドの名論文「伽藍とバザール」(日本語訳)を読んでみて下さい。)
例えばP2Pみたいなものは、1番のフラットなネットワークということで、ある意味クライアント/サーバー型よりもインターネットの理想に近いし、Web API公開みたいなものは6や7の思想に近いです。ただWeb APIの場合は、Java RMIやCORBAなんかの宣伝文句だった分散サービスの考え方の方が近いかもしれませんが。
8、9はまさに「永遠のベータ版」というWeb2.0の考え方ですね。4、5、9なんかはCGMに通じると思います。

結局、当時やや青臭いと思われていたインターネットの思想って、実は今も連綿と続いているんだと思います。それはインターネットが成立/発展する過程で、プロトコルやオープンソース、サービスの開発を通じてその有効性が実証され、またハッカーの文化としても残ってきました。

ということで、例えばWeb3.0なんてものが出てきたとしても、ここら辺の思想をやっぱり引き継いでいくんだろうな、という気がしてます。

6 月 7

本日、画像センシングシンポジウム2007(略してSSII)に参加してまいりました。

実は斎藤先生が、このシンポジウムのプログラム委員をされている関係で、人が足りない為のお手伝いということで、スタッフとして参加してきました。

半日の手伝いで午後は丸々シンポジウムを見学できると言うことなので、 会社の了解も得た上で手伝うことを決めたわけですが、本職が忙しいのに朝5時置きと、最初は引き受けたことを少々後悔しました。が、実際参加してみると色々と発見があり、参加した甲斐がありました。

SSIIは、画像処理技術の「実用化」に重点が置かれているため、企業の参加が多いのが特徴です。特に私が参加した7日午後のセッションが「ここまで来た!メディア解析・検索技術の最前線」ということで、まさにジェイマジックの業務に関係のある分野における各企業の取り組みを知ることができました。 

 



このセッションではNTTレゾナント、NHK、日立、ジャステックの方々が、それぞれ自分達の取り組みを紹介してましたが、全体的に画像検索技術を活用した実際のサービスが、今後どんどん世の中に出てくるであろうという印象を受けました。市場が大いに盛り上がる反面、ジェイマジックの競合が増えそうです。(笑)

画像認識技術という意味ではオーソドックスなやり方をしてますが、従来のネットのデータベース化の技術や検索技術、インターフェース技術を組み合わせることで、なんとかユーザの欲しがる情報を効率的に取得しようと各社独自に工夫してるようです。あんまり細かくなるのでここでは書きませんが、参考になりました。


あと、ライブデモセッションで人を多く集めていたのが、オムロンの人物属性推定のデモ。リアルタイムでカメラに写った人の年齢と性別を判別します。



たまに、僕のことを10代と判定してくれると、思わずうれしくなったり(笑)。こういう技術をeyenowa顔ちぇきに入れたら面白そうですね。 

 

余談ですが、展示されている企業の方と名刺交換をさせていただいたときに、「顔ちぇきをやってる会社です」というと、「ああ」という反応が返ってきます。中には「ブログ書いている方ですか?」とまで言ってくる方も・・・。

やっぱり画像認識エンジニアにとっても「顔ちぇき」って気になる存在なんですね。

6 月 3

大分間が空いてしまいましたが、博士課程に入学するまでの経過の続きです。今回は、やや手続き的な話がメインです。

ニブンビジョンをリストラされたことがきっかけで、博士課程へ進むことを決心し、またジェイマジックへの就職を決めたところまで前回書きました。その後、たまに研究室に顔を出しつつ、先生と方針を話し合い、願書を提出したのが2007年の1月中旬です。
ここで書類審査後、場合によっては面接があるのですが、僕の場合は免除となり、3月の頭には合格となりました。ここら辺は自分が修士を取った出身研究室に戻るということで、審査がゆるかったのかもしれません。
書類審査と言っても、書いたのは自分の学歴及び簡単な職歴、学部や修士での研究概略や、志望動機、研究したいテーマなどで、特に「受験」的な筆記試験等はまったくありません。

また別の例ですが、ニブンビジョンの同僚で、同じく社会人ドクターを目指している方がいます。この方の場合、学部卒で修士号は持っていないのですが、社会人になってから、とある企業の研究所で研究に従事していました。その後ニブンビジョンに転職したのですが、わずか半年足らずで僕と同じく解雇になり、その際研究所の頃の知り合いの大学教授に、ドクターを取りたい旨を相談したところ、その先生の下で研究することを許されたそうです。
この方の場合、修士号は持っていませんでしたが、研究所での成果を提出して、「修士卒業レベルの知識がありますよ」ということを証明する事で、博士課程の受験資格を得ました。
その後は、無事書類審査、面接を通り博士課程へ進学されました。

というわけで、僕の知る限りでは博士課程へ進む場合、とにもかくにもまずは進みたい研究室の先生と合意が事前に取れていた方が良いようですね。

それから、社会人をしながらドクター取得を目指す場合、会社から受験承諾証というものをもらって提出しなければなりません。つまり会社から博士課程に進むことを了解してもらう必要があります。
僕の場合は、前回の記事に書いたとおり、元々ジェイマジック社長の宮田さんが知り合いだったと言うことで信頼関係ができていたのと、入社の前提条件に半分学生をやるということを了承してもらっていたので、ここら辺は問題ありませんでした。
しかし、大半の社会人ドクターの場合は、研究は土日のみという場合が多いようです。(そのニブンビジョンの同僚の方の場合もこのパターンです)
僕が話を聞く限りでは、この週末ドクターのパターンは研究テーマが自分の仕事の内容と関係しているか、修士の研究の延長戦上でもなければ実際のところなかなか取得は厳しいようです。
また、会社の研究職にいる方ならば、その会社でやった研究内容を元に博士号を取得するという道(いわゆる論文ドクター)や、その企業から大学に派遣されてフルタイムで研究をするという幸福なパターンもあります。

以上、ここに書いたことは基本的に僕が体験&見聞きした情報によるものなので、博士課程進学に当たって色々と例外もあるかもしれません。それでも少しでも博士課程進学に興味のある方の参考になれればと思います。