原田・黒瀬・椋田研究室について
実世界理解,コンテンツ生成や知識発見を目指した高度な知能システムの実現
原田・黒瀬・椋田研究室は,実世界から有益な情報を抽出し,サイバー空間の膨大なデータと強力なコンピューティング能力と結びつけ,実世界理解,コンテンツ生成や知識発見可能な高度な知能システムの構築を目指しています.
研究室にはスタッフと学生とを合わせて約60人のメンバーが在籍しており,数理基盤やロボティクスを含むコンピュータサイエンス全般を活用して研究を進めています.
主な研究のトピック,キーワードは以下のようになっています.
-
実世界情報数理基盤
情報理論,機械学習,深層学習,データマイニング,パターン認識,確率・統計理論,時系列解析,因果解析,学習理論,特徴抽出理論 -
実世界情報処理,認識,理解
コンピュータビジョン,マルチメディア,画像認識・検索,三次元情報処理,画像セグメンテーション,行動認識,マルチモーダル認識,面白い事象の発見,ニュース性発見,対話理解,感情理解,音声・音楽情報処理 -
コンテンツ生成
画像・動画の自然言語記述と要約,自然言語からの画像生成,人と雑談可能な対話システム,実世界の面白い事象の発見と記事生成 -
知能ロボット 強化学習,軌道最適化,動作計画,タスク計画,模倣学習,メタ学習,継続学習,Sim to Real,高速推論,SLAM,三次元再構成,エッジでの学習,人とのインタラクション
これらのトピックやキーワードから,具体的には以下のような研究が生み出されています.
WebDNN
高性能なコンピュータを持っていなくても,手元にあるスマートフォンなどのWebブラウザで,最先端の深層学習技術を高速実行できるフレームワークです.人工知能研究のデモンストレーションや,ユーザがカメラで撮影した画像を処理するサービスなどの開発が促進されることが期待されます.
Neural 3D Mesh Renderer
単一の二次元画像に写っている物体の三次元的な形状を理解し,3Dメッシュモデルのレンダリングを行うシステムです.Voxelを用いた従来の手法よりも美しい3Dモデルを生成することができ,また,二次元画像のスタイルをメッシュ上に転写することができるなど,様々な応用の可能性を持っています.
言語と画像の「マルチモーダル」研究
近年,Visual Question Answering(VQA)と呼ばれる「画像と質問を提示されたときに,正しい答えを導き出す」タスクが,画像と言語とのマルチモーダルな取り組みとして注目されています.弊研究室では2016年に行われた国際会議CVPRでのコンペティションで,世界一位(アブストラクト画像部門)を獲得しました.
弊研究室からは,これら以外にも様々な取り組みが発表されています.
より詳しくは,実績や研究をご覧ください.
過去の卒論・修論テーマはこちらをご覧ください.
研究室のビジョンやその実現に向けて現在取り組んでいるテーマ/トピックについて、研究室を主宰する原田 達也 教授にインタビューした記事がブログに掲載されておりますので、こちらもご覧ください。