“機械ならでは”の知能=マシンインテリジェンスの実現をめざして―原田 達也

東京大学 先端科学技術研究センター マシンインテリジェンス分野(原田・髙畑・長・椋田研究室)は、計算機による知能の実現をめざし、それを支える技術や理論の研究を手がける研究室です。

今回は、この研究室のビジョンやその実現に向けて現在取り組んでいるテーマ/トピックについて、研究室を主宰する東京大学 先端科学技術研究センター 原田 達也 教授に語ってもらいました。

わたしたちの研究室がめざすこと

わたしたちの研究室は、“機械ならでは” の高度な知能システムの実現をめざす研究室です。

一般に言われる「人工知能」という言葉からは、人間の知的能力をそのまま機械に当てはめて形にするような印象を受けます。しかし、わたしたちがめざす知能システムは、必ずしもそういった人間に似せたものであるとは限りません。

人間には身体という器があり、その器に制約を受ける形で人間の知能が存在します。この器が異なれば制約のあり方が変わってしまうため、当然、適切な知能も異なるはずです。極端な例ではありますが、昆虫に人間の知能を載せるとどうなるでしょうか?身体構造やサイズ、エネルギー消費量など多くの観点で、適切でないと想像できます。

さらに、人間であっても進化の途上にありますから、人間の知能は現時点で “準最適” だと言えたとしても、 “最適” なものである保証はありません。もちろん、研究の過程で人間の知能の原理から得られるヒントは山のようにありますが、これにこだわることで逆に本質を見誤る可能性もある訳です。

これらをふまえ、人間の知能は人間に適した形であり、機械には機械に適した知能=マシンインテリジェンスがあるだろうと。それをつくっていこうと、わたしたちは研究に取り組んでいます。
研究分野としては、人工知能、機械学習、コンピュータビジョン、自然言語処理、音声処理、ロボティクスなどに当たります。

====

この “マシンインテリジェンスの実現” というビジョンのもと、つくりたい知能システムの問題と制約の本質を見極め、機械による実世界の認識やその認識にもとづく行動(例えば、機械が「画像に何が写っているか」を識別したり、識別した情報をもとに自動運転を行ったり…)など、何か人の役に立つものをアウトプットすることは ひとつの大きな目的であり、ワクワクすることでもあります。

ただ、それだけに終始するのではなく、もう少し根本的な “原理・原則を明らかにすること” も、大切な目的として意識していたいと思っています。
個別のアウトプットを形にする中で、それぞれに共通する問題を見つけたり、現在使われている原理の不完全さに気づいたりとさまざまなヒントを得ながら……例えば「これまで別のものだと説明されていた知能システムも、この ひとつの理論ですべて説明がつく」というような、統一的な原理・原則を見つけたいのです。

その発見によって「人工知能」と呼ばれるもののあり方を根本から変えることが、今まで機械にできなかったことを実現させたり、機械の性能を高めたりすることにつながり、世の中のためになれば嬉しいなと思っています。

わたしたちの研究室が “今” 掲げる3つのテーマと、多様な研究トピック

わたしたちの研究室が注力するさまざまな研究について、ここでは3つのテーマを掲げてご説明したいと思います。

  1. 少ない教師データから、高精度な予測モデルをつくる
  2. データを一箇所に集めることなく知能システムをつくる
  3. 既存モデルの土台となる部分(=空間)自体から再構築を試みる

【少ない教師データから、高精度な予測モデルをつくる】

既存のモデルでは学習する際に大量のデータが必要で、それを人の手で用意するには多くの労力がかかってしまいます。また例えば、医療データの場合には多忙な医師の力を借りる必要があったり、個人に適合したデバイスをつくる場合は個人でデータをとってラベル付け(※)をしなければならなかったりと、大量のデータの用意が難しい場合も。だからこそ、少ない教師データ(機械学習に利用するデータ)からでも高精度な予測ができるモデルの実現をめざすことを、まず1つめのテーマとしています。

また計算機に実世界の幾何学的モデルや常識を自動的に獲得させることも、“他に転用できる知識を構築する” という観点で、教師データ量の削減につながると考えています。

※ 機械がデータを正しく理解し予測を行えるように、データ内の要素にラベル≒注釈をつけることを指します。

【データを一箇所に集めることなく知能システムをつくる】

「データ」を取り巻くさまざまな問題についても考えなくてはなりません。

例えば、個人のプライバシー保護を重視する動きが世界で広まる中、個人情報の取り扱いやデータの第三者提供にまつわるルールは厳しくなってきており、今後データを集めること自体が難しくなると考えられます。
また現在、データセットにおける人種をはじめとしたバイアスの存在が指摘され、バイアスを取り除こうとする取り組みも行われています。しかし、人々の倫理観や道徳観は時代とともに変化するものですから、“いつの時代にもバイアスのない完璧なデータ” はつくれないはずです。求められるのは、バイアスが生じるということを前提とした知能システムなのではないでしょうか。

これらをふまえ、データを一箇所に集めて学習させるのではなく、“分散した状態のデータをもとに学習を行い、個々の学習結果を統合する” 形で大きな知能システムをつくれないか、というのが2つめのテーマです。
これが実現すれば、プライバシーを守りながらの学習が可能になりますし、分散した小さなデータならその時代ならではの倫理観・道徳観を反映したマネジメントも容易になるのではと期待しています。

【既存モデルの土台となる部分(=空間)自体から再構築を試みる】

ニューラルネットワークなどのモデルには土台(※)があり、その土台の上で各研究者がさまざまなテーマの研究に取り組んでいる一方、土台の部分を変えようという動きはまだあまり多くはありません。しかし、現在のモデルの課題を解決するためには、土台から根本的に再構築する必要があると捉えています。これが、3つめのテーマです。

※ ここでの土台とは、空間のことです。ほとんどのニューラルネットワークは、平坦で性質のよい空間(「ユークリッド空間」と呼ばれます)が用いられますが、問題の対象によっては曲がった空間(「非ユークリッド空間」と呼ばれます)が適切な場合も存在します。例えば言葉の意味を扱う場合には、平坦な空間よりも曲がった空間が適切です。

====

これら3つのテーマをベースとして念頭におきながら、わたしたちの研究室ではさまざまなトピックの研究を行っています。

・数理基盤
情報理論、機械学習、深層学習、データマイニング、パターン認識、確率・統計理論、時系列解析、因果解析、学習理論、特徴抽出理論 

・認識、理解、思考
コンピュータビジョン、画像認識・検索、三次元情報処理、行動認識、マルチモーダル認識、感情理解、意図推定、自然言語処理、音声・音楽情報処理、医療情報処理、ビッグデータ

・コンテンツ生成
画像・動画の自然言語記述と要約、自然言語からの画像生成、人と雑談可能な対話システム、実世界の面白い事象の発見と記事生成

・知能ロボット
強化学習、軌道最適化、動作計画、タスク計画、模倣学習、メタ学習、継続学習、Sim to Real、高速推論、SLAM、三次元再構成、エッジでの学習、人とのインタラクション

未来の研究者へ

ここまでわたしたちの研究室が取り組むテーマやトピックをご紹介してきましたが、これらが “すべて” ではなく、またこれらが “正解” であるとも限りません。

批判的な視点や、わたしの思考の範囲にとどまらない独自のアイディアをもって、一緒に対話や探求に取り組んでいただければ嬉しいですし、学生の数だけ研究の幅や興味範囲が広がっていくことを歓迎します。

少しでも「機械や知能システムに興味がある」「原理・原則を見つけてみたい」という方は、ぜひわたしたちの研究室で一緒に研究を楽しみましょう。

取材・文・写真=原田・髙畑・長・椋田研究室広報担当