【研究紹介 #02】AIによる認識の性能を高める “特徴抽出”

原田・髙畑・長・椋田研究室の研究を紹介するインタビュー連載。第2回となる今回は、AIによる認識を支える「特徴抽出」の研究を手がける 椋田 悠介(むくた ゆうすけ)先生に話をききました。

椋田 悠介

東京大学先端科学技術研究センター 原田・髙畑・長・椋田研究室 講師

AIによる正しく・効率的な認識に欠かせない「特徴抽出」

―まずは、先生の研究テーマを教えてください。

椋田:わたしは “計算機に賢く実世界を認識させること” を専門としていて、中でも「特徴抽出」を主な研究対象として扱いながら、「より認識の性能を高めるためにAIのモデルをどのようにデザインすべきか」を考えています。

特徴抽出とは、AIが正しく・効率よくデータを認識できるように、そのデータの中から認識の手がかりとなる情報をAIが扱いやすい形(=数値列)で取り出すこと。

▲画像認識のしくみ

例えばAIによる画像認識では、りんごの写真をデータとして直接認識するのではなく、まず画像のデータから “りんごらしさ” をよく捉えた特徴を抽出し、それらをもとに「画像に写っているのはりんごだろう」と推測しているのです。

わたしの研究では、この特徴抽出のフェーズで “より認識に役立つ情報” を取り出すために、AIのモデルのあり方を工夫することに取り組んでいます。

―「特徴抽出」を研究テーマに選んだのはなぜですか?

椋田:高校生の頃からAIへの漠然とした興味を持っていた中で、自分の仲間になるような賢い知能をつくりたいなと、それも “なんとなく” ではなく「こうすれば上手くいく」と納得できるような方法でつくりたい、と思うようになったことが原点です。

そのためにも、膨大な実験にもとづいて性能のよい認識アルゴリズムをつくるのではなく、性能向上の理由が理論的に説明できるようなアルゴリズムをつくることに挑戦しようと、特徴抽出というテーマに取り組みはじめました。

回転や反転の影響を受けずに正しく画像認識ができる、賢いAIを目指す

―今取り組んでいる研究内容を、くわしく教えてください。

椋田:回転や反転といった変換が画像に加えられたとしても、その影響を受けずに画像認識が行えるようにするための研究に取り組んでいます。

▲反転や回転の影響を受けない画像認識の実現をめざす

つまり……画像を回転・反転させても、写っているもの自体は変わらない。その “変わらなさ” を教え込むことで、逆さまのりんごの画像からでも「これはりんごだ」と正しく認識できる、賢いAIを実現したいと思っています。

具体的なやり方としては、「反転不変性」という制約を与えて特徴抽出モデルを組むことで、学習されたモデルの出力から「反転」の影響が消える、そんなモデルをつくっています。
もし本当にこのモデルが実現できていれば、もとの画像とそれを反転させた画像をインプットしたときに、それぞれから同じ特徴が取り出されて。その結果、それぞれの認識の結果も同じになるといえますね。

―研究の醍醐味は、どんなところにあると思いますか?

椋田:この領域では、理論や計算から「こうすれば上手くいく」というアルゴリズムを導くことも、その上で実際に手を動かして実装し、思っていた性質が満たされているかを確かめることもできます。このアルゴリズムづくりと実験的な評価の両方が楽しめるところが、一番の醍醐味かなと思っています。

▲研究を支える計算機サーバー

多様なデータや変換を扱う特徴抽出に挑戦したい

―研究において、今後チャレンジしたいことを教えてください。

椋田:今は主に画像を扱っていますが、今後は3Dの物体をはじめとした別の形のデータも扱ったり、また反転や回転以外の変換も扱ったりと、研究の幅を広げていきたいと思っています。

ただ、不変性という観点から特徴抽出モデルを組む手法はある程度確立されてきたので、今後は不変性に限らず幅広い知識をモデルに組み込むための手法を考えていきたいです。

 

【この研究テーマに応用される知識】

■関数
認識とは入力データと出力ラベルを結びつける関数なのです。

■ベクトル
特徴量は特徴ベクトルとも呼ばれます。中学高校では幾何学と結び付けて学ぶことの多いベクトルですが、大学ではベクトルがより幅広い概念であることを学習します。

■行列
行列はベクトルを変形するための基本的な構成要素です。

■微分
現在AIの学習には微分が不可欠です。

 

取材・文・写真=原田・髙畑・長・椋田研究室広報担当