原田研究室

原田研究室について

実世界とサイバー空間の融合で、人を超えた知能システムの実現を目指す

WebDNN, Neural 3D Mesh Renderer, ジャーナリストロボット

原田研究室は,私たちの生きる世界(実世界)から役に立つ情報を抽出してサイバー空間に取り込み,得られた膨大なデータを強力なコンピューティング能力と結び付けることで,「人間の知能を超えた実世界知能システム」を構築することを目指しています.

研究室にはスタッフと学生とを合わせて約60人のメンバーが在籍しており,数理基盤やロボティクスを含むコンピュータサイエンス全般を活用して研究を進めています.

主な研究のトピック,キーワードは以下のようになっています.

これらのトピックやキーワードから,具体的には以下のような研究が生み出されています.

WebDNN

高性能なコンピュータを持っていなくても,手元にあるスマートフォンなどのWebブラウザで,最先端の深層学習技術を高速実行できるフレームワークです.人工知能研究のデモンストレーションや,ユーザがカメラで撮影した画像を処理するサービスなどの開発が促進されることが期待されます.

Neural 3D Mesh Renderer

単一の二次元画像に写っている物体の三次元的な形状を理解し,3Dメッシュモデルのレンダリングを行うシステムです.Voxelを用いた従来の手法よりも美しい3Dモデルを生成することができ,また,二次元画像のスタイルをメッシュ上に転写することができるなど,様々な応用の可能性を持っています.

BC learning

音の認識において深層学習技術は高い性能を示していますが,弊研究室では教師情報の与え方を工夫した新たな学習方法を提案し,より高い性能を達成しました.例えば,従来は「犬の鳴き声」と「猫の鳴き声」を別々に学習していましたが,これらを混ぜ合わせた中間的な音を教師情報として学習させることで,それぞれの音の特徴をより捉え,区別できるようになります.この手法が画像に応用できることも明らかにしました.

言語と画像の「マルチモーダル」研究

近年,Visual Question Answering(VQA)と呼ばれる「画像と質問を提示されたときに,正しい答えを導き出す」タスクが,画像と言語とのマルチモーダルな取り組みとして注目されています.弊研究室では2016年に行われた国際会議CVPRでのコンペティションで,世界一位(アブストラクト画像部門)を獲得しました.

弊研究室からは,これら以外にも様々な取り組みが発表されています.
より詳しくは,実績研究をご覧ください.