【論文紹介】Style-NeRF2NeRF: 3Dシーンのスタイル転写
本論文"Style-NeRF2NeRF: 3D Style Transfer from Style-Aligned Multi-View Images"では、多視点画像から深層学習によって構築された3DシーンのNeRFモデルに対し、スタイル転写を行うための手法を提案しています。本稿では著者の藤原 晴雄がこの研究について解説します。本研究は2024年12月開催のSIGGRAPH ASIAにて発表予定です。
【論文紹介】sRGB事前学習モデルをRAW画像に適応させるアプローチ「RAW-Adapter」
私たちの論文「RAW-Adapter: Adapting Pre-trained Visual Model to Camera RAW Images」では、カメラの画像素子からの未処理のセンサーデータからなるRAW画像に着目し、NLPおよびCV分野で進行中のアダプター研究に着想を得て、sRGB事前学習モデルをカメラRAWデータに適応させることを目的とした新しいアプローチ「RAW-Adapter」を提案しています。本稿では著者の崔 子藤がこの研究について解説します。本研究は2024年のThe 18th European Conference on Computer Vision (ECCV 2024)に採択されました。
【論文紹介】ジョイント 誤差に基づくマルチクラスPU 学習によるオープンセットドメイン適応に関する研究
本研究では、オープンセット ドメイン適応のための新しい理論を提案します。論文では、PU 学習とジョイント エラーによるターゲット タスク全体のリスクを厳密に制限するエンドツーエンド アルゴリズムを提案し、幾つかのベンチマークでSOTAパーフォーマンスを達成できました。本稿では著者の張 徳軒がこの研究について解説します。本研究は2024年のThe 18th European Conference on Computer Vision (ECCV 2024)に採択されました。
【論文紹介】画像からの不適合抽出と解決による識別的ユーモアキャプションの生成に関する研究
私たちの発表した論文「Content-Specific Humorous Image Captioning Using Incongruity Resolution Chain-of-Thought」ではマルチモーダル大規模言語モデルを用いて、画像の細かい特徴を捉えたユーモラスなキャプションの生成を実現しました。本研究は2024年のNorth American Chapter of the Association for Computational Linguistics (NAACL Findings)にて発表されます。
【論文紹介】GPAvatar: 画像からの汎化可能かつ精密なヘッドアバターの生成
ヘッドアバターを忠実に再構築し、表情とポーズを正確に制御するためには、既存の手法ではトレーニングに大量の個別データが必要であり、表情の制御はまだ十分に精確ではありません。今回、私たちはこれらの問題に取り組み、論文「GPAvatar: Generalizable and Precise Head Avatar from Image(s)」を発表しました。この研究について、本稿では著者のXuangeng Chuが解説します。
【論文紹介】オンライン強化学習においてベルマン誤差の歪みを補正するQ学習
近年、深層強化学習の分野では、歪んだ誤差分布が学習に悪影響を及ぼすことが指摘されています。その問題に取り組み、新しい手法を提案した論文「Symmetric Q-learning: Reducing Skewness of Bellman Error in Online Reinforcement Learning」について著者の大村が解説します。
【論文紹介】低光補正と露出補正をしつつ3次元画像を生成する研究
本記事では,AI分野のトップ学会の一つであるAAAIに採択された本研究室博士課程学生のCuiさんの論文「Aleth-NeRF: Illumination Adaptive NeRF with Concealing Field Assumption」について紹介します.
【論文紹介】未知物体認識のための知識を質問生成によって獲得する研究
本記事では,コンピュータビジョンのトップジャーナルであるIJCVに採択された上原助教の論文「Learning by Asking Questions for Knowledge-Based Novel Object Recognition」について紹介します.
【論文紹介】物体の形状や構造についての教師情報・事前知識を用いない、姿勢を自由にコントロールできる3D表現の学習
姿勢を自由にコントロールできるような多関節物体の3D表現を得るには、既存の手法では物体の姿勢を示す教師情報や構造についての事前知識が必要であり、これらを含むデータの構築には多くのコストがかかります。
今回は、この課題を克服するための新たな学習手法を提案した論文「Watch It Move: Unsupervised Discovery of 3D Joints for Re-Posing of Articulated Objects」について、著者の野口 敦裕が解説します。
【論文紹介】画像中の物体についての“知識獲得”が可能な質問文生成の実現
今回は、画像中の物体についての知識を獲得できるような質問文生成の実現に向け、モデルの提案を行った論文「K-VQG: Knowledge-aware Visual Question Generation for Common-sense Acquisition」について、著者の上原 康平が解説します