【論文紹介】Gradual Transition from Bellman Optimality Operator to Bellman Operator in Online Reinforcement LearningNew!!
「強化学習(Reinforcement Learning, RL)」は機械学習の一種で、たとえば、ロボットやゲームの操作を学ぶために使われます。 今年7月にカナダのバンクーバーで開催された国際会議 International Conference on Machine Learning (ICML) 2025 では、連続動作向けのRLアルゴリズムに関して、ベルマン最適作用素からベルマン作用素へ徐々に移行する減衰手法を提案する論文 "Gradual Transition from Bellman Optimality Operator to Bellman Operator in Online Reinforcement Learning" を発表しました。この成果により、ロボットが少ない試行回数で効率的に学習できるようになり、これまで学習コストの大きさのために良く学習できなかったいくつかのタスクの学習が可能になりました。将来的には、産業用ロボットや自動運転車など「学習コストが高い分野」で特に役立つ可能性があります。
オープンな日本語Vision&Languageモデル「Asagi」の開発
本研究室では、142億パラメータを持つ、日本語に特化したオープンなマルチモーダルモデルを開発しました。本研究の成果は、3月に開催される言語処理学会第31回年次大会 (NLP2025)で発表予定です。
プリンストン大学 交換留学報告 第二回
プリンストン大学Vision & Learning Labへの交換留学報告の第二回は、博士1年の馬上から研究室での生活や、キャンパスとその周辺の様子についてお届けします。
プリンストン大学 交換留学報告 第一回
プリンストン大学のJia Deng教授が主宰するVision & Learning Labに、本研究室から4人の学生が交換留学生として、6月から8月の間に派遣されました。滞在中の経験などについて、リレー形式で全3回に分けて報告していきます。第一回は修士1年の吉川が滞在中の生活や、街の様子などについて説明します。
【論文紹介】Style-NeRF2NeRF: 3Dシーンのスタイル転写
本論文"Style-NeRF2NeRF: 3D Style Transfer from Style-Aligned Multi-View Images"では、多視点画像から深層学習によって構築された3DシーンのNeRFモデルに対し、スタイル転写を行うための手法を提案しています。本稿では著者の藤原 晴雄がこの研究について解説します。本研究は2024年12月開催のSIGGRAPH ASIAにて発表予定です。
【論文紹介】sRGB事前学習モデルをRAW画像に適応させるアプローチ「RAW-Adapter」
私たちの論文「RAW-Adapter: Adapting Pre-trained Visual Model to Camera RAW Images」では、カメラの画像素子からの未処理のセンサーデータからなるRAW画像に着目し、NLPおよびCV分野で進行中のアダプター研究に着想を得て、sRGB事前学習モデルをカメラRAWデータに適応させることを目的とした新しいアプローチ「RAW-Adapter」を提案しています。本稿では著者の崔 子藤がこの研究について解説します。本研究は2024年のThe 18th European Conference on Computer Vision (ECCV 2024)に採択されました。
【論文紹介】ジョイント 誤差に基づくマルチクラスPU 学習によるオープンセットドメイン適応に関する研究
本研究では、オープンセット ドメイン適応のための新しい理論を提案します。論文では、PU 学習とジョイント エラーによるターゲット タスク全体のリスクを厳密に制限するエンドツーエンド アルゴリズムを提案し、幾つかのベンチマークでSOTAパーフォーマンスを達成できました。本稿では著者の張 徳軒がこの研究について解説します。本研究は2024年のThe 18th European Conference on Computer Vision (ECCV 2024)に採択されました。
【論文紹介】画像からの不適合抽出と解決による識別的ユーモアキャプションの生成に関する研究
私たちの発表した論文「Content-Specific Humorous Image Captioning Using Incongruity Resolution Chain-of-Thought」ではマルチモーダル大規模言語モデルを用いて、画像の細かい特徴を捉えたユーモラスなキャプションの生成を実現しました。本研究は2024年のNorth American Chapter of the Association for Computational Linguistics (NAACL Findings)にて発表されます。
【論文紹介】GPAvatar: 画像からの汎化可能かつ精密なヘッドアバターの生成
ヘッドアバターを忠実に再構築し、表情とポーズを正確に制御するためには、既存の手法ではトレーニングに大量の個別データが必要であり、表情の制御はまだ十分に精確ではありません。今回、私たちはこれらの問題に取り組み、論文「GPAvatar: Generalizable and Precise Head Avatar from Image(s)」を発表しました。この研究について、本稿では著者のXuangeng Chuが解説します。