Research
【論文紹介】画像からの不適合抽出と解決による識別的ユーモアキャプションの生成に関する研究

私たちの発表した論文「Content-Specific Humorous Image Captioning Using Incongruity Resolution Chain-of-Thought」ではマルチモーダル大規模言語モデルを用いて、画像の細かい特徴を捉えたユーモラスなキャプションの生成を実現しました。本研究は2024年のNorth American Chapter of the Association for Computational Linguistics (NAACL Findings)にて発表されます。

Read more