10 月 1

ご無沙汰してます。10月の頭に入って少し忙しさも落ち着いたので、9月におこったもろもろについて、ご報告させていただきたいともいます。

1.技術評論社連載終了

途中、学会発表やら何やらで大分時間が空いてしまいましたが、無事連載が終了いたしました。

「OpenCVで学ぶ画像認識」

連載を持つというのがそもそも初めてのことだったので、貴重な経験ができました。この機会を与えてくれた技術評論社の方、背中を押してくれたジェイマジックや友人の皆様、そして読者の皆さんに感謝したいと思います。 

2.後期の授業開始

9月25日から、大学も後期の授業が始まりました。せっかく学費を払っているので、僕も(博士課程は特に授業を取る必要はないのですが)応用統計解析という授業を一つとりました。内容的には僕の研究分野との係わりも大きいので、楽しみにしてます。さてさて、ちゃんと授業についていけるかな・・・?
社会人になると数学を勉強する機会というのはなかなかとれないので、この機会を有効に使いたいと思います。

3.電気学会論文誌への投稿

昨日はじめて論文誌へ自分の研究を投稿いたしました。本当にぎりぎりまで、必死に実験してました。
博士号取得までには論文誌に最低2本が掲載されなければいけないのですが、そのための貴重な一本です。この後、査読にまわされて掲載の可否が判定されます。頼むからのってくれ~!

以上が、近況です。これから某国際学会への発表を準備しつつ、自分の研究をもっと発展させていこうと思ってます。

9 月 18

宮田さんのブログにもご紹介いただきましたが、先日WebクリエーションアウォードでWeb人賞という賞をいただきました。

自分が「Webマーケティングの発展に寄与した」という自覚はまったくないんですが(笑)、素直にうれしいです。これも「顔ちぇき!」を支えてきた皆さんのお陰でいただけた賞だと思います。

どうもありがとうございました。

7 月 29

最近、立て続けに取材を受けました。

最初は某ローカルテレビ番組で、そのうち放送になる予定です。 

もう一本はWebクリエーションアワードというWebマーケティングの発展に寄与したとのことで、「顔ちぇき!」がエントリーされてまして、その一次審査通過の際に受けたインタビューです。

http://award.wab.ne.jp/winner6/
http://award.wab.ne.jp/2008/523.html

 

そもそも「顔ちぇき!」って狙って作ったものではないので、半分学生の分際でこういうインタビューを受けるのは、ちょっとこそばゆい感じがします。

6 月 1

先日、ASCII.jpというWebマガジンの方から取材を受けました。

顔ちぇき!一周年ということで、当時の開発者だった僕に白羽の矢がが立ったみたいです。 
http://ascii.jp/elem/000/000/135/135745/

なんか、オクスフォード大の研究についての解説が紙面の半分近くを占めてます。(笑)

10 月 8

僕が社会人ドクターを目指していると言うと、色々な質問を受けます。
例えば前回のVIP2007では、
「別に大学に戻らないでも、自分自身でやろうと思えば勉強ができる場合もあると思いますが、なぜわざわざ大学に戻ったんですか?」

と聞かれましたし、友人には

「なんで働いてるのに、わざわざ博士課程に進むの?」
「教授になりたいの?」
「研究者になりたいの?」
「会社興したいの?」

なんてことを聞かれます。

でも、別に大した意味なんか無いんです。ただ自分のやりたい勉強がしたいだけなんです。
企業に入ってしまったら、お給料をもらっている立場上どうしても自分の好きな勉強なんてやるわけにはいきません。会社の時間を使う以上、会社の利益に貢献する必要があります。
僕の場合、画像認識はまだまだ勉強中で、それよりは今まで自分がキャリアを築いてきたIT系のスキルを生かした方が、多分一番目先の利益には貢献できるだろうと思います。

実際、ジェイマジックの前職で、ニブンビジョンという(googleに買収された)顔認証技術の会社に入社したのは、当時の僕のスキルでは画像認識技術の開発者という立場で働くのは難しいので、僕がすでに持っていたIT系のスキルなどを活かしながら、画像認識のスキルを伸ばそうとう意図でした。ところが入社してみると、自分の現状のスキルで目の前の案件をこなすのに精一杯で、とても新しいことにチャレンジする余裕なんてありませんでした。ニブンビジョンの技術の中身は社員にも公開されてないので、せいぜい関係ありそうな論文をあさって、行き帰りの電車の中で読むくらいのことしかできませんでした。

でも今は、自分で学費を払い、会社からもコミットした時間分のみの給与をもらうことで、誰にも文句を言われず大手を振って、自分の将来にとって必要と思われる勉強ができます。
大学に進むことで、確かに大学の研究のためのインフラや先生の指導、学会への参加など色々なメリットがありますが、一番は大学進学という大義名分を元に時間を確保できることだと思っています。

もっとも、今自分のやっている研究テーマはジェイマジックのやっていることと近いですし、僕も徐々にこの分野で会社に貢献できそうだという自信がついてきました。なので、今後うまくこの2つを融合できないか思案中です。

じゃあ、大学を卒業したら?自分で専門知識を身につけたらやっぱり研究者になるの?というと、これもちょっと微妙です。というのは、世界の一流の研究者たちの研究を知るに付け、とても自分はかなわいなあっと思ってしまうので・・・。
というわけで僕は今までの自分のキャリアを活かす事で、研究者ではなく「テクニカルソリューションアーキテクト」(造語)というような立ち位置の人間になりたいなあと思っています。が、この辺の話はまたいずれ。

8 月 30

本日、とあるきっかけがあって、字幕.in/satoru.netの矢野さとるさんとクレイジーワークスの村上福之さんにお会いしました。

矢野さんは、Yahoo、ライブドア、uhuruなどを務めた後、会社を辞めて個人の趣味でsatoru.netというサイトを運営されていました。その中の「字幕.in」という、動画にユーザが勝手に字幕を付けらるというサービスが大ヒットしたため、そのサービスだけ株式会社化して、今は「字幕.in」の代表取締役を務める傍ら、引き続きsatoru.netで新しいサービスを作られています。

一方、村上さんはパナソニックで画像処理関係の仕事に従事された後に、現在の会社を立ち上げて携帯コミック製作ツールなどを作られているそうです。

今回お二人は「写メちぇけ」という投稿写真が他人にどう見えるかをユーザに判定させるサービスを開発しまして、それが縁で「顔ちぇき」を開発した僕と情報交換しましょうという話になりました。

以前、ITmediaで矢野さんに関する記事を読んでいたので、今回お会いできたのは光栄でした。お二人の技術のお話やモノ作りに対する姿勢など、一技術者として非常に刺激になりました。

特に矢野さんの、新しいアイデアを思いついてから、とりあえず作ってバグだらけでもいいから公開してしまい、そこから更に新しいことを思いついたり、ユーザからフィードバックを得ることで改良を繰り返すというそのスピード感が、個人でやっているサイトならではだなあと感じました。これが組織でやっていたりすると、もっと分業が進んでいて、確かにより良いものができるかもしれませんが、開発や変更・改良に時間がかかったりすると思います。一方、個人で作っていれば、自分で色々なところをいじくりながら、ずっと頻繁にTry&Errorが繰り返すことができます。

一応僕はラボの人間なので、ラボの中で「とりあえず動くもの」を個人で作るこの開発スタイルというのは非常に使えるんじゃないかと思いました。幸い僕は画像認識技術に関するスキルと一応はサーバー構築のスキルはあるので、個人で画像認識技術を応用したなんらかのデモサイトを作ることができます。そうやって自分なりに画像認識技術の使い方を「とりあえず動くもの」として提案することで、今まで自分が感じていた「この技術使ったら面白いことができるはずなのに、いまひとつ周りにその良さが伝わらない」というもどかしさの解決策になるのではと思いました。

問題は、僕がベンチャーの求めるスピード感で、どれだけ頻繁にデモをリリースできるかということですが・・・。

 

それと、お二人に共通して感じたのは、やはり技術者としてモノ作りを楽しんでいるなあと言うことです。やっぱり自分も楽しんでいるからこそ、人が集まるようなサイトが作れるんでしょうね。

そういえば、よくオープンソースコミュニティのハッカー達が、自分達のソフトがなぜ商用ソフトに負けないか、という裏づけとして使うAlfie Kohnの報酬と動機についての心理学の研究を思い出しました。
これは、人を報酬で釣ってある活動をさせた場合、何も言わずに活動をした場合に比べてパフォーマンスが落ちる場合があるという理論です。例えば、「良い絵が描けたらご褒美をあげるよ。」と言われた子供と、何も言われずに絵を描いた子供とでは、何も言われなかった子供の方が良い絵を書くというものです。
これは、元々子供は絵を描くこと自体を目的で楽しんでいたのに、報酬をちらつかせてしまうと、子供は絵を描くことよりも報酬をもらうことが目的になってしまうためだと言われています。つまり報酬を与えるという行為が、クリエイティビティを阻害してしまったわけです。

技術屋にとっては、お金儲けよりも、モノ作り自体を楽しむ心や環境の方が大事なんですよね。お二人と話をしていてそんなことを思いました。

==============

ところで一昔前の日本のIT業界の有名人って、ソフトバンクの孫さんや楽天の三木谷さんなど、経営者ばかりだった気がするんですが、最近は矢野さんの他にもRubyのまつもとゆきひろさんとか、技術者の有名人が増えてきた気がします。

嬉しい傾向です。

8 月 21

気がつけば、前回の更新から約一ヶ月・・・。

皆様ご無沙汰しております。

 

というわけで近況報告。

仕事の方ですが、今はSAYLプロジェクトや色々な画像認識エンジンの評価などなど、様々なことにクビを突っ込んでます。

大学の研究の方は、ある既存研究の実装を進めています。こちらは当初の予定から2-3週間ほど遅れてます。気持ちは焦ってますが、楽しんで研究してます。 

 

どちらも忙しく、なかなか時間の区切りが難しいので、現在会社とは勤務形態を変えようかという話をしてます。入社当時は、2-3週間集中して仕事したら次の2-3週間は大学という働き方を考えていたのですが、実際は2-3週間も会社に来ないことなど不可能に近いので、例えば曜日を決めて1週間に2日は強制的に会社に来ない日を設けようということを検討してます。

この2-3週間ごとに会社と大学を切り替えるという働き方は、主にバイト的な感じでの作業(プログラミングやテストなど)を中心に考えていたためでしたが、実際はプロジェクト管理とまではいかないまでも、マネジメント的な仕事も入ってきてしまっているため、どうしても定期的に出社せざるを得ません。 

まあ、元々人手が足りてないというのもありますが、自分で自分の仕事を増やしてる部分もあるかもしれません。例えば僕がSAYLに関わることになったのは、僕自身がSAYLの基本アーキテクチャを提案したせいだし、画像認識エンジンの評価の中には自分から会社に提案しているものも
あります。

ただそれでも「これに手を付けたら研究がヤバイ」と思って、気付いているのに見送った仕事も数多く・・・。最近は社員も少しずつ増えてきて、僕が手を出せなかったところや、そもそも気付かなかったところに徐々に手が届くようになってきましたが。

いずれにせよベンチャーに入社した以上は、受身的に仕事するよりは積極的に仕事に関わった方が楽しいには違いありませんし、実際に楽しいです。ただ、研究がどうしても気になって、どこかで躊躇してしまう自分がいます。

研究自体もこれから先試してみたい手法や勉強したいこと、読みたい論文、そしてその中にはビジネスに応用できそうなことがたくさんあって、時間はいくらあっても足りません。

うまいこと会社の仕事と大学の研究がWin-Winになるように持って行きたいのですが・・・。

7 月 22

7月18日から20日までの3日間、東京ビッグサイトで行われたワイヤレスジャパン2007にジェイマジックが出展しましたが、僕も微力ながら初日と最終日の前半に説明員などでお手伝いさせてもらいました。 

お蔭様で初日の午前中から盛況で、ずっとしゃべりっぱなしでした。中でも今回の展示会でお披露目したMagic  Loupeのデモが非常に好評でした。このMagic  Loupeは「実世界と仮想世界をつなぐ虫眼鏡」という、ジェイマジックが目指している世界観を伝えるために作成したコンセプトモデルで、携帯電話のカメラをCDにかざすだけで楽曲が視聴できるというものです。IT mediaにも取り上げられました

下の写真は、初日に取材に来たズームインスーパーの様子です。

 
070718_1758~0001.jpg

また今回、顔ちぇきがモバイルコンテンツフォーラム主催のモバイルプロジェクトアワード2007のコンテンツ部門優秀賞をいただきまして、7月19日に授賞式が会場で行われました


授賞式の途中、なぜかアイドルのライブが始まったりして、びっくりしました。聞いたところ、毎年やってるみたいですね。

 

というわけで非常に慌しい1週間でしたが、実りも多かったと思います。さて、今週は溜まった仕事と研究を片付けねば(^^;)

5 月 1

どうも、久しぶりの更新です。
先日、弊社より「顔ちぇき!」が正式にリリースされましたが、ここしばらくずっとこの開発に携わっていたため、このブログの更新が滞ってました。しかも公開してから、ITmediaCNETなど各種メディアで取り上げられ、更にはmixiニュースにも紹介されたことから、予想を遥かに上回るアクセスが集中して、しばらくはその対応に忙殺されてました。

というわけで、本当は前回の続きで入学手続きの話でもしようかと思ったですが、タイムリーなので「顔ちぇき!」の話を書こうと思います。

この「顔ちぇき!」は顔認識技術を使うことで、送った顔写真と有名人とのそっくり度を診断しようという、マジメな画像認識エンジニアは顔をしかめそうなサービスです。
顔認識技術は、入退出管理や、マシンへのログインなどの際に「本人認証」を行うことを目的として開発されています。流行りのバイオメトリクスの一種ですね。多くの顔認識エンジンは、通常エンジン内のデータベース中に登録してある顔と、入力された顔画像との相似率というのを出力し、その相似率がある閾値を超えたときに「本人」であると認証する仕組みになっていますが、「顔ちぇき!」では、その相似率を「そっくり度」としてユーザに表示しています。

なんでマジメな画像認識エンジニアが顔をしかめるのか、それは機械が判定する「そっくり度」と人間が判定する「そっくり度」というのが基本的に違うものだからです。
確かに昔から画像認識の分野では、人間の認識の仕組みをベースにして、顔認識なんかをやろうという研究は色々ありました。例えば僕がジェイマジックの前に勤めていたニブンビジョンの顔認識エンジンは、ガボールウェーブレット変換という、人間の低次の視覚系を模した仕組みを利用してます。
とはいえ、そもそも人間の認識の仕組みと言うやつ自体が、まだ全然わかってなくて(とはいえ、面白い研究は最近出てきてます)、今世の中に出ている顔認識技術の大半は、人間の脳の仕組みが解明されるのを待ってたらいつまでたっても製品ができないので、とりあえずなんとか使えるものを作ったれ、ということで作られたものばかりです。前述のニブンビジョンのエンジンでも、ガボールウェーブレットより上位ではまったく独自のアルゴリズムを使ってます。

そのため、この「顔ちぇき!」の企画を聞いた僕が一番に思ったことは、「顔認識技術と人間が感じるそっくり度はそもそも別物だし、もしそれをやろうと思ったら顔の特徴量と人間の主観の相関を調べてやるとか、ちょっと研究めいたことが必要になるんじゃないのか?」というものでした。
「そんなマジメなこと考えずに、とりあえず作ってみようよ」という営業の提案もあったので、まずは営業のデモツールとして、Web上で入力した顔画像に対し、相似率の高い登録画像を順に表示する、というデモを作成しました。

僕はどうせ、『これ違うじゃん』というリアクションが来るだろうと思っていたんですが、実際は『違ったら違ったで面白い』というものでした。

そしてあれよあれよと言う間に、お客様先での導入が決まり、以後「顔ちぇき!」サービスの公開、そしてアクセスの爆発へと続くわけです。

実は僕は、この「顔ちぇき!」成功のパターンに、技術が世の中へ広まっていくパターンの一つの典型が現れているんじゃないかと思ってます。が、またまた長くなったので、この続きは次回(多分・・・)

4 月 9


CA350010.jpg

会社の皆さんから、素敵なCROSSのボールペンをいただきました!

素敵なお心遣い、ありがとうございます!

格好いいなあ、このペン。(^^)