国際会議 ECCV 2026 に4本の論文が採択されましたNew!!
コンピュータビジョンに関するトップカンファレンスの一つである ECCV 2026 (The 19th European Conference on Computer Vision) において、当研究室から4本の論文が採択されました。
国際会議 IROS 2026 に1本の論文が採択されましたNew!!
ロボティクス分野におけるトップカンファレンスの一つである IROS 2026 (2026 IEEE/RSJ International Conference on Intelligent Robots and Systems)において、当研究室から1本の論文が採択されました。
NTIRE 2026 Challenge
2026年6月3日から7日まで、米デンバー州の Colorado Convention Center にて、コンピュータビジョン分野のトップ会議である CVPR が開催されます。この CVPR において併催される “NTIRE 2026” は、画像の復元や強調に関するワークショップであり、様々なチャレンジ(競技会)が開催されます。
NTIRE 2026 において、当研究室は2つのチャレンジの運営に参加しています。
国際会議 ICML 2026 に1本の論文が採択されました
機械学習分野のトップ会議 ICML 2026 (Forty-Third International Conference on Machine Learning) において、当研究室から1本の論文が採択されました。
【論文紹介】SceneProp: Combining Neural Network and Markov Random Field for Scene-Graph Grounding
視覚グラウンディング(visual grounding)は、文章などの特定物体を指し示す記述から画像内の対象物を特定するタスクであり、ロボット操作における指示文の理解や、対象物の特定が不可欠な画像に対する質問応答など、さまざまな応用において重要な役割を果たします。 当研究室から発表された論文 "SceneProp: Combining Neural Network and Markov Random Field for Scene-Graph Grounding" では、文章の代わりに物体間の関係性を構造化した形式を用いることにより、GPT-4o など既存の手法では不可能だった複雑なグラウンディングを可能にしました。 本論文は、主要なコンピュータビジョンの国際学会のひとつであるWinter Conference on Applications of Computer Vision (WACV) 2026にて発表されました。
この成果により、ロボットにおいて指示文へ追従する精度の向上や、視覚言語モデルと組み合わせることにより、さらなる画像に対する質問応答の性能向上が期待できます。
【論文紹介】Dr. RAW: Towards General High-Level Vision from RAW with Efficient Task Conditioning
標準的なコンピュータビジョンではRGB画像が一般的に使用されていますが、RAWデータを直接扱う方法も注目を集めています。2025年12月にアメリカのサンディエゴで開催された機械学習のトップカンファレンス Neural Information Processing Systems (NeurIPS) 2025で、私たちは、カメラの RAW データから物体検出やセグメンテーションなどの高度なビジョンタスクを効率的に実行するための統合フレームワーク「Dr. RAW」についての論文 "Dr. RAW: Towards General High-Level Vision from RAW with Efficient Task Conditioning" を発表しました。
このフレームワークにより、事前学習済みモデルにセンサーの事前情報を賢く組み込むことで、堅牢で汎用的な視覚システムを構築することが可能になります。
【論文紹介】Improved 3D Scene Stylization via Text-Guided Generative Image Editing with Region-Based Control
3D空間の再構築、および領域ごとの緻密な制御を伴う編集技術は、エンターテインメント領域の3Dアセットやデジタルツインの効率的な編集・更新を可能にする基盤となります。当研究室から発表された論文 "Improved 3D Scene Stylization via Text-Guided Generative Image Editing with Region-Based Control" では、テキスト指示に基づいて、領域ベースの制御を可能にした3D Gaussian Splatting [1] シーン向けの改善された3Dスタイル転写手法を提案しています。本研究は主要なグラフィックスの国際学会のひとつであるPacific Graphics 2025にて発表されました。
この成果により、映画やゲーム制作におけるアセット制作の効率化が図ら
れるだけでなく、実社会に即したデジタルツインの高度な構築・編集が可能になります。これにより、都市計画における景観シミュレーションや、embodied AIの学習に不可欠な3D環境の整備といった、幅広い産業応用への貢献が期待されます。
【論文紹介】DEJIMA: 大規模な日本語画像キャプション・視覚的質問応答データセットの構築
近年、画像の内容を言葉で説明したり、画像について質問に答えたりする「Vision-and-Language(V&L)」と呼ばれるAI技術が急速に発展しています。こうした技術の性能は、学習に使える画像とテキストのペアのデータセットの質や量に大きく左右されます。ところが、日本語で使える大規模なデータセットはこれまでほとんど存在しませんでした。
今年5月に開催される国際会議 LREC 2026 にて、当研究室から、日本語の画像キャプション(画像の内容を文章で説明したもの)と VQA(Visual Question Answering:画像についての質問に回答するタスク)に使える大規模データセット「DEJIMA」を提案する論文を発表予定です。DEJIMA は、約388万組の画像とテキストのペアを含み、従来の日本語データセットの20倍以上の規模を達成しています。
国際会議 LREC 2026 に1本の論文が採択されました
言語リソースと評価に関する国際会議 LREC 2026 (The Fifteenth biennial Language Resources and Evaluation Conference) において、当研究室から1本の論文が採択されました。 採択された論文は、スペインのパルマ・デ・マヨルカで5月11日から16日まで開催される会議において発表されます。 [LREC 2026 のウェブサイト] LREC 2026 に当研究室から採択された論文
【論文紹介】A Theory of Learning Unified Model via Knowledge Integration from Label Space Varying Domains
「ドメイン適応(Domain Adaptation)」は、十分な教師情報がない目標のドメインでうまく働くモデルを、十分な教師ラベルを持つ別のドメインの情報を活用して作成する手法です。この手法は目覚ましい成功を収めていますが、既存のドメイン適応システムでは、複数のソースドメインから学習した知識を統合することを目指す場合に、問題設定を簡略する必要があり、現実問題にうまく対応できませんでした。2025年6月にアメリカのナッシュビル、Music City Center にて開催された国際会議 The IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR) 2025 では、実世界でしばしば出現する「ソースフリー」のシナリオに対応するためのアルゴリズムを提案する論文 “A Theory of Learning Unified Model via Knowledge Integration from Label Space Varying Domains” を発表しました。この成果により、将来的には、エッジデバイスなどで蓄積された知識を統合し、より性能の高いモデルを効率的に構築出来る事が期待されます。








