11 月 15

今さらですが、あちこちで話題になっている芸者東京エンターテイメント「ARis」について書いてみます。

ARisって何?っていう人は、とりあえず以下の動画を見てください。

これは、Augumented Reality(以下AR)というコンピュータ・ビジョンの分野では長いこと研究されている技術を応用したものです。ARとはカメラで撮影した画面上に、CGなどを自然に重畳表示する技術で、カメラで撮影したマーカーの画面上の映り方から、カメラの相対位置を計算することで自然なCGの重ね合わせが実現できます。

ARisで用いられている技術は典型的なAR技術で、ビジョンの研究者からしてみれば特に技術的に何か真新しいということはありません。ただ、その応用方法が非常に素晴らしいと思っています。

現在のAR技術の大きな制約としては、マーカーがカメラの中に映っていないと使えないという点で(最近は、使わないものも出てきてるけど)、例えばARの応用例として語られているような、ヘッドマウントディスプレイをつけて街中を歩くと、街の至る所に仮想空間の情報(例えばレストランを見たら、そのメニューが現れるとか)といった使い方は、いちいちマーカーを設置しなければいけないため、なかなか難しいわけです。

が、このARisのような使い方であれば、特にマーカーがストレスになることもないでしょう。しかも、マーカー付きの棒で突っつくことでキャラクターとコミュニケーションを取るというのは、僕の知る限りあまりないアプローチだと思います。

こういう技術の性質をおさえつつ、ちょっとひねったアプリケーションを作ることができるのは、企画者の中にAR技術の表面だけでなく中身までちゃんと知っている人間がいるということだと思います。もちろんTry & Errorを繰り返しながら、アイデアを練っていったんだろうとは思いますが、少なくとも技術を理解していなければ、こういう発想はできないと思います。

最近、画像認識技術は色々な形で市場に出てきていますが、僕から見ていて「この技術をこんな使い方してもダメじゃん」と思うことがたくさんあります。せっかくユニークな面白い技術、もしくは可能性がある技術なのに、結局どこかの類似サービス(何とは言いませんが・・・)になっていて、非常にもったいないなあと思ってしまいます。多分企画者は、その技術の目に見える部分しか理解していないんだろうな、と感じます。

というわけで、芸者東京エンターテイメントって面白い会社だなあ、と思いました。

6 月 3

経営者と学生のIPA討論会の話が、あちこちで話題になっているようですね。

「10年は泥のように働け」「無理です」――今年も学生と経営者が討論

「IT技術者はやりがいがある仕事か」—学生とIT産業のトップが公開対談

僕が特に気になったのは、情報処理推進機構の理事で、元NEC代表取締役社長の西垣さんの台詞。

============================================================

「数として欲しいのは,金融システムなど企業の大型システムに従事する人間。こういった領域では,個人の能力よりは業務ノウハウが重要。プログラマとして優秀であっても,業務を理解しないと,よいシステムができない。技術だけを評価して処遇することは企業としては難しい」

「天才プログラマのように技術を極めるのであればそれを生かす道に行くべきであって,企業に入って大型システムを開発するのはもったいないか向いてない」

============================================================

プログラマと言うものをどういうレベルでとらえるかにもよりますが、日本の大手IT企業の元社長の発言としては少し残念です。
確かに大型システムを導入する上では、業務ノウハウは重要だし、上流での要件定義や設計などなどを誤れば使いものにならないシステムになります。またプロジェクトマネージャーの善し悪しによって、システムのクオリティや導入コストが大きく左右されるのは間違いありません。
でも、だからといって天才プログラマがいらないという結論にはならないと思います。例えば良いコードを書くことで性能が10分の1になれば、それだけサーバー台数が減ってコスト削減につながりますし、頭の良いプログラマは複雑な処理をとてもシンプルに作成することができるため、メンテナンス性は上って、運用コストや先々のアップグレードなどなどのコストも削減できます。(実際、今仕事の現場で良いプログラマの重要性というものを実感しています。)

それに大型システム相手の仕事でも、より生産性のあがる共通コンポーネント作らせるとか、マネジメント次第でいくらだってプログラマのクリエイティビティを活かせる仕事を生み出せるんじゃないでしょうか。

確かに、システム開発があまりに属人的になるのは問題です。ある程度プログラマの質にばらつきがあったとしても、うまくシステムができあがるようにということで、統一プロセスなどの様々な開発プロセスが検討されているし、それはそれで価値のあるものだとは思います。

ただ、それでもクリエイティブなプログラマは、案件毎ではない、より根幹の開発効率や業務効率、技術の面からの新しいソリューションを生み出せるのではないのでしょうか?

例えば、僕の専攻しているコンピュータ・ビジョンの分野は、工数をかければ良いものができるというわけではありません。むしろ10人がかりでお金をたくさんかけてできなかったことを、たった一人の天才がやってしまうような世界です。

残念なことに、西垣さんようなプログラマに対する考え方が日本のIT業界では主流だと思われます。
多分、多くのIT企業がシステムの受注額を、そのシステム自体の価値ではなく人月計算で見積もるのが、プログラマの価値を貶めている一つの理由かもしれませんね。優秀でないエンジニアでもその分の工数の金額がお客さんから受注できるなら、企業の利益には関係ないわけですから。

============================================================

「未踏でスーパークリエータに認定された技術者が3人Googleに就職したが,それはいいことだと思っている」

「彼らには何年かして日本で起業して欲しい。そこまでのステップを踏まないと新しい流れは生まれない」

=============================================================

この台詞からは、西垣さん自身が日本のIT業界の改善をあきらめてしまっているように聞こえてしまいます。

なんとも寂しい話ですね。

2 月 25

2月23、24日と伊東の温泉宿で開発合宿をしてまいりました。

080224_11490001.jpg

といっても、ジェイマジックとも大学ともまったく関係なく、完全なプライベートです。研究室の後輩で、現在D社に勤めているambeeさんに誘われて、色々な企業で開発や研究に携わっている方々と、泊りがけで開発をしてきました。

開発合宿は各々勝手にテーマを選んで(あるテーマによっては複数人で)、温泉宿に篭ってひたすらコーディングをする、疲れたら温泉に入る、というなんとも奇妙なイベントで、実際男8人が一つの部屋に集まってひたすらPCに向かっている様は、かなり異様な風景でした。

なんでも、こういう開発合宿というのは、2-3年くらい前からIT系のエンジニアの間で流行っているらしく、開発合宿のノウハウを集めたこんなサイトもあったりします。

今回集まったメンバーも非常に多彩で、検索エンジン、画像処理、セキュリティ、 ネットワークなどなど、専門はバラバラですが、みんなコーディングが大好きといった人たちで、合宿の間中僕の聞きなれない用語が飛び交ってました。お蔭様であまり僕が普段使わない技術についても知る機会を得られて、大変刺激になりました。

もちろん、ただ各々勝手に開発するだけではなく、わからないところがあったら周りに聞けば、ほとんど誰かしら答えを知っています。他にも中間発表や最終成果発表というものもあって、「こいつらこの短期間にこんな凄いもん作ったんか・・・」というようなものばかりで、軽く嫉妬しました(笑)。

いずれにせよ、こういうプライベートの開発合宿では、ビジネスになりそうかとか、研究テーマになりえるかとか考えずに、とにかくその時一番自分が興味がある技術にチャレンジできるのがよいですね。実際、今回みんなが作ってたものって、とってもオバカなことを最新の技術使ってやるぞ~、みたいなものばかり。(真面目なものもありましたが、オバカなやつがやたらと目立ってた。)

でも、案外こういう制約を取っ払って好き勝手にモノ作りする中から、次のビジネスの種も生まれそうな気もします。実際、今回の合宿でも「これ世に出したら面白いぞ」というものが出てきてましたし。




というわけで、とっても楽しいイベントでした。僕はというと、大学での研究テーマをつい最近変えたため、しばらく眠らせていたオブジェクト認識のコードを掘り起こして改良したものを発表しましたが、あとちょっとのところでバグが取れず・・・。また次回もあるようなので、今度は新ネタを持ってリベンジしたいと思います。

1 月 17

お久しぶりです。

前回の更新から気がつけば3ヶ月・・・。ちゃんと生きてますよ~。

この3ヶ月ですが、主にSAYLプロジェクトとそれに関わる新しい広告配信の仕組みについて、ずっと開発リーダーとして関わってました。

今年はこれらのプロジェクトにはアーキテクトとして引き続き参加しつつも、より大学の研究に力を入れていく予定です。いずれこのブログに書くと思いますが、より仕事と研究を密接に絡めていくつもりでいます。

というわけで、あまり頻度は高くないかもしれませんが、ぼちぼち更新していきますので何卒よろしくお願いいたします。

話が変わりますが、この休み中に久しぶりに論文以外の本を読みました。

福岡伸一 「生物と無生物のあいだ」

DNAの螺旋構造を解明したワトソンとクリック、ウィルキンスやロザリンド・フランクリンの話や、生命の本質について考察したシュレーディンガーやシェーンハイマーなど、生命の謎に挑んだ科学者達の物語を生き生きと綴った良書です。

生命の本質は「動的平衡状態」であるというのがこの本の主張ですが、僕の世界観にしっくりはまりました。 思えば経済も、進化も、生態系も、全て「動的平衡状態」だなと思います。そして僕が関わっている画像認識に強く影響を与えている脳の研究や、仕事で関わっているインターネットなんかにも通じそうな考え方です。

久々にワクワクする読書体験ができました。

では皆様、今年もよろしくお願いいたします。

8 月 30

本日、とあるきっかけがあって、字幕.in/satoru.netの矢野さとるさんとクレイジーワークスの村上福之さんにお会いしました。

矢野さんは、Yahoo、ライブドア、uhuruなどを務めた後、会社を辞めて個人の趣味でsatoru.netというサイトを運営されていました。その中の「字幕.in」という、動画にユーザが勝手に字幕を付けらるというサービスが大ヒットしたため、そのサービスだけ株式会社化して、今は「字幕.in」の代表取締役を務める傍ら、引き続きsatoru.netで新しいサービスを作られています。

一方、村上さんはパナソニックで画像処理関係の仕事に従事された後に、現在の会社を立ち上げて携帯コミック製作ツールなどを作られているそうです。

今回お二人は「写メちぇけ」という投稿写真が他人にどう見えるかをユーザに判定させるサービスを開発しまして、それが縁で「顔ちぇき」を開発した僕と情報交換しましょうという話になりました。

以前、ITmediaで矢野さんに関する記事を読んでいたので、今回お会いできたのは光栄でした。お二人の技術のお話やモノ作りに対する姿勢など、一技術者として非常に刺激になりました。

特に矢野さんの、新しいアイデアを思いついてから、とりあえず作ってバグだらけでもいいから公開してしまい、そこから更に新しいことを思いついたり、ユーザからフィードバックを得ることで改良を繰り返すというそのスピード感が、個人でやっているサイトならではだなあと感じました。これが組織でやっていたりすると、もっと分業が進んでいて、確かにより良いものができるかもしれませんが、開発や変更・改良に時間がかかったりすると思います。一方、個人で作っていれば、自分で色々なところをいじくりながら、ずっと頻繁にTry&Errorが繰り返すことができます。

一応僕はラボの人間なので、ラボの中で「とりあえず動くもの」を個人で作るこの開発スタイルというのは非常に使えるんじゃないかと思いました。幸い僕は画像認識技術に関するスキルと一応はサーバー構築のスキルはあるので、個人で画像認識技術を応用したなんらかのデモサイトを作ることができます。そうやって自分なりに画像認識技術の使い方を「とりあえず動くもの」として提案することで、今まで自分が感じていた「この技術使ったら面白いことができるはずなのに、いまひとつ周りにその良さが伝わらない」というもどかしさの解決策になるのではと思いました。

問題は、僕がベンチャーの求めるスピード感で、どれだけ頻繁にデモをリリースできるかということですが・・・。

 

それと、お二人に共通して感じたのは、やはり技術者としてモノ作りを楽しんでいるなあと言うことです。やっぱり自分も楽しんでいるからこそ、人が集まるようなサイトが作れるんでしょうね。

そういえば、よくオープンソースコミュニティのハッカー達が、自分達のソフトがなぜ商用ソフトに負けないか、という裏づけとして使うAlfie Kohnの報酬と動機についての心理学の研究を思い出しました。
これは、人を報酬で釣ってある活動をさせた場合、何も言わずに活動をした場合に比べてパフォーマンスが落ちる場合があるという理論です。例えば、「良い絵が描けたらご褒美をあげるよ。」と言われた子供と、何も言われずに絵を描いた子供とでは、何も言われなかった子供の方が良い絵を書くというものです。
これは、元々子供は絵を描くこと自体を目的で楽しんでいたのに、報酬をちらつかせてしまうと、子供は絵を描くことよりも報酬をもらうことが目的になってしまうためだと言われています。つまり報酬を与えるという行為が、クリエイティビティを阻害してしまったわけです。

技術屋にとっては、お金儲けよりも、モノ作り自体を楽しむ心や環境の方が大事なんですよね。お二人と話をしていてそんなことを思いました。

==============

ところで一昔前の日本のIT業界の有名人って、ソフトバンクの孫さんや楽天の三木谷さんなど、経営者ばかりだった気がするんですが、最近は矢野さんの他にもRubyのまつもとゆきひろさんとか、技術者の有名人が増えてきた気がします。

嬉しい傾向です。

7 月 12

研究室のドクター同期から教えてもらった記事です。

「博士」も定職が見つけられず…ポストドクター1万5000人超

僕は社会人ドクターなので就職難の心配はありませんが、これって日本にとってどうなんでしょう。これって「研究」というものが日本企業から軽んじられてるってことなんでしょうか?それもありそうですが、大学というものが企業から軽んじられているんじゃないかなあという気もしてます。

実際、僕が新卒で就職活動した時は面接担当者に「大学でやってきたことは関係ないから」ってはっきりと言われましたし、就職した会社では理系で修士号を取った人間を営業に使うなんて非常にもったいないことしてました。(僕も危うく営業にさせられるところでした)

せっかく博士号取ったのに、就職しても自分の専門とは違う研究をさせられてる人って結構いるみたいだし、企業にしてみれば「3年間も余計に大学で勉強したせいで、新卒者よりも余計な専門性が身について、しかも歳もとってて使い辛い」という感じなのではないかと邪推してしまいます。

僕にはこの問題をどうすれば良いのかまったくわかりませんが、やり切れませんねえ。

7 月 11

ソニーコンピュータサイエンス研究所発の2つの技術ベンチャーが立ち上がったことがITmediaの記事に出ていました。

片方の技術は、モーションポートレートという1枚の顔写真から顔の3次元モデルを作成するというもので、もう一つが「Place Engine」という無線LANの電波の強さから位置情報を割りだすという技術です。

1枚の画像から3次元モデルを作成するのは、あらかじめ顔の3次元モデルを用意しておき、それを2次元画像へフィッティングすることで求めているようです。前回書いたfotowooshよりは、ある程度モデルが既知なので、技術的なハードルは低いと思われます。ちなみに似たような技術をPolar Roseというスウェーデンの会社も実用化しているみたいです。 ただ、ソニーの技術はキャラクター画像にも対応しているというのが、なかなかユニークだと思います。

実は一枚の顔画像から3次元復元をするという技術と、無線LANから位置情報を割り出すと言うどちらの技術も、3、4年ほど前に当時僕の上司だったMさんが実用化しようと目論んでいたものでした。

今を遡ること4年前、僕は最初に入社した某大手外資系メーカーをリストラされ、小さなベンチャー企業に就職しました。その1年後に今度はそのベンチャーが、取引先のGIS(地理情報システム)の会社(今年の初めに倒産)に吸収されました。 このベンチャー企業とGISの会社で僕の上司だったのがMさんです。実はこのMさんの専門が画像認識で、そのおかげで僕は画像認識を自分のこれからの仕事にしていこうと思うようになりました。

この方は、どういうわけか世界中の超一流の画像認識の研究者と知り合いで、ベンチャーを立ち上げてはその人達の技術を実用化する、ということを長年やっています。僕もこの方の下で働いていた頃、プロジェクトマネージャーみたいな形で何度か海外の大学とやり取りしたことがあります。

その知り合いの中にスイス、バーゼル大のThomas Vetter教授がいるのですが、この方は1999年に一枚の顔画像から顔の3次元情報を復元して、認証させると言う研究を発表しています。僕がそのベンチャーに勤めていた時に、この技術を実用化しようという話が持ち上がり、僕も技術面で色々と協力する予定だったんですが、クライアントとの折り合いが付かず、結局プロジェクトがうまく立ち上がりませんでした。

また、その後吸収されたGISの会社でも、無線LAN情報を使った位置測定技術の研究を計画していたのですが、会社側の体制の問題でこちらも実現できずに終わりました。

今更ながら、Mさんの先見の明は大したものだと思います。ただ、やはり当時Mさんの周りの環境が整わず、そうこうしているうちに資金力と環境を持っているところがきちんと実用化してしまいました。まあ、そのMさんのことだから、またもっと新しい技術を見つけて取り組んでいることだろうと思いますが。

僕の頭の中にも実現したいアイデアや研究はたくさんあるんです。でも、僕の場合はMさんのようにうまくそれを周りに説得できるだけの実力がない・・・。僕がどんなに面白いと思っていても、その凄さや面白さというのはなかなか周りに伝わらないんです。 

そうこうしているうちに、今回のように他がどんどん面白いことをやってしまうだろうと思うと、一日でも早く実力をつけたいと強く思います。だからこそ、今の博士課程の勉強を頑張らねば!

6 月 25

このブログでは、政治の話はしないようにと思ってたんですが・・・。

法律学者ローレンス・レッシグのブログにこんなエントリーが出ていました。
「必読:これからの10年」

レッシグはサイバー法に関する第一人者で、インターネットがもたらした社会的変化によって生じた法律や民主主義上の問題を記した「CODE」をはじめ、インターネット時代の著作権問題について記述した「コモンズ」、「Free Culture」などの優れた著作を残しています。(実は今、ようやく積読していた「Free Culture」を読んでいる最中なんです。)
特にここしばらくは、現代の著作権期間の延長などの著作権強化の政策が、社会全体の文化的なイノベーションを阻害しているという立場から、研究だけでなくクリエイティブ・コモンズを組織するなど社会的な活動を行ってきました。

そのレッシグが、ネットワークの問題から別のテーマへ重心を移すそうです。
レッシグが今後取り組みたいと言うテーマは、政治の腐敗という、昔から再三繰り返されてきたテーマです。これはレッシグ自身も実際に著作権強化の反対活動などを通して直面してきた問題で、例えば彼はRIAAというアメリカ合衆国のレコード会社の業界団体や、ハリウッド、ディズニーなどのロビイストの活動が政治に大きく関与してきたのを目の当たりにしてきました。これは贈収賄だけの問題ではなく、合法的な政治献金も含まれます。(ちなみにレッシグは別に著作権に反対しているわけではありません。ただ今の著作権「強化」の政策が、これら古いコンテンツ産業を保護するためのもので、新しいクリエイティビティや産業の芽を摘み、総じて社会全体にとってはマイナスの影響を与えるバランスを欠いたものだということを問題視しています。)

これは昔から民主主義/資本主義が抱えてきた大きな問題で、力のある企業が自分達の現在のマーケットの優位性を守るためになんらかのロビー活動を行って、政策に影響を与えるのは良くあることだし、法律に触れなければ企業にとっては十分に合理的な行動です。 

この問題は、僕自身も著作権問題だけでなく、イラク問題や日本の公共事業の問題などを見るにつけ、常に考えていたことなので、レッシグのような優れた学者がこの分野に挑むということを非常に嬉しく思っています。

本人は、この分野では自分がまだまだ初心者だと言っています。しかも

「幻想は抱いていない。10年が経過しても、この問題がまだ存在していることは99.9%確信している。だが、失敗の確実性はときに挑戦の理由となる。この場合にもそれはあてはまる。」

とある通り、かなり困難な道なのを承知しています。それでも現実の問題を直視してきた結果、それにあえて取り組みたいというレッシグの姿勢はすばらしいです。

レッシグが認める通りこの分野で大きな進展が生まれるとは考えづらいですが、それでもまた彼が「CODE」の時のように僕の目からウロコを落としてくれることを期待しています。



6 月 20

既にWeb2.0ブームというのは落ち着いて定着してきた感がありますが、今のドコモ2.0とか、少し前だと楽天2.0とか、やっぱり相変わらず「2.0」というのは流行しているみたいですね。

と思っていたら、ひろゆき氏がITmediaのインタビューでこんなこと言ってます。

「Web2.0は大嫌い」とひろゆき氏 ニコ動有料版で「もっと面白くしたい」

僕もこのWeb2.0っていうのがそこまで騒ぎ立てるほど真新しいものかな、という気がしてならなかったので、この記事の中の
「Web2.0とは技術革新でも新しいビジネスチャンスでもなく、人間本位の仮想社会をとりもどすいわばWebルネサンスとでもいうべきもの」
という指摘には頷くものがあります。(「お金を稼ぎたい人たちが人をだますための用語として使われているような気がしていて」にも思わず共感(笑))

例えばWeb2.0の中にくくられる技術としてはAjaxやブログ(特にRSS)といった技術があるけど、これなんて昔からあるHTTP、XML、JavaScriptを使っているだけで、とりたてて新しいわけではないです。

Web2.0で騒がれるもうひとつは、サービスの形態です。例えばSNSやブログ、YouTube、WikipediaなんかかはCGM(Consumer Generated Media)と呼ばれていて、今までは企業がコンテンツをつくって発信していたものが、ユーザに自由にコンテンツを作らせることで、ユーザが集まれば集まるほどサイトの価値が上がるようになっています。

でもこれもハッカーがオープンソースとかの開発で昔からやってたことのような気がします。今までこういう試みが技術の層だけだったのがサービスの層にまで出てきたという点が新しいですが。

結局のところ、Web2.0全体に流れる技術であれ思想であれ、昔からインターネットの根底に流れていた思想がより具現化してきたことにすぎないんじゃないかと思うんです。

例えば、インターネットが世に出てきた当初に宣伝されていた文句としては、こんなのがあります。

  1. オープンでフラットなネットワーク。
  2. 人種や国境を越えて誰でも参加可能。
  3. 巨大企業や国家がコントロールできない
  4. 個人が情報発信することで、巨大メディアに負けない力を持てる。
  5. ボランティア、人の善意によって作られたネットワーク

やや、こういうアナーキーな感じに憧れて、僕はこの業界に入りました(笑)。

それと、インターネットの世界における技術発展は、ハッカーのボランティアによるところが大きいですが、ハッカーのモノ作りの方法論としては、例えばこんなのがあります。

  1. 一からコード書くのも良いけど、使いまわせるものは使いまわそう。
  2. 書いたコードは公開してしまおう。
  3. 書いたコードを早めに、頻繁にリリースすることで、ユーザからのフィードバックをもらおう。
  4. たとえバグのある状態でリリースしてしまっても、ユーザの数が十分多いなら誰か治し方を知っている。

ほら、結局これってWeb2.0の特徴と呼ばれているものに一致するように見えませんか?(ちなみにこのオープンソースの開発手法をより知りたい方はエリック・レイモンドの名論文「伽藍とバザール」(日本語訳)を読んでみて下さい。)
例えばP2Pみたいなものは、1番のフラットなネットワークということで、ある意味クライアント/サーバー型よりもインターネットの理想に近いし、Web API公開みたいなものは6や7の思想に近いです。ただWeb APIの場合は、Java RMIやCORBAなんかの宣伝文句だった分散サービスの考え方の方が近いかもしれませんが。
8、9はまさに「永遠のベータ版」というWeb2.0の考え方ですね。4、5、9なんかはCGMに通じると思います。

結局、当時やや青臭いと思われていたインターネットの思想って、実は今も連綿と続いているんだと思います。それはインターネットが成立/発展する過程で、プロトコルやオープンソース、サービスの開発を通じてその有効性が実証され、またハッカーの文化としても残ってきました。

ということで、例えばWeb3.0なんてものが出てきたとしても、ここら辺の思想をやっぱり引き継いでいくんだろうな、という気がしてます。