論文の概要: MUStReason: A Benchmark for Diagnosing Pragmatic Reasoning in Video-LMs for Multimodal Sarcasm Detection
- arxiv url: http://arxiv.org/abs/2510.23727v1
- Date: Mon, 27 Oct 2025 18:03:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.404001
- Title: MUStReason: A Benchmark for Diagnosing Pragmatic Reasoning in Video-LMs for Multimodal Sarcasm Detection
- Title(参考訳): MUStReason:マルチモーダルサーカスム検出のためのビデオLMにおける実用的推論のベンチマーク
- Authors: Anisha Saha, Varsha Suresh, Timothy Hospedales, Vera Demberg,
- Abstract要約: VideoLMは、サルカズム検出のような複雑なタスクに苦労する。
MUStReasonは、モダリティ固有の関連キューのアノテーションが豊富な診断ベンチマークである。
PragCoT は VideoLM を利用して,文字通りの意味よりも暗黙の意図に焦点をあてるフレームワークである。
- 参考スコア(独自算出の注目度): 16.725936163763684
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Sarcasm is a specific type of irony which involves discerning what is said from what is meant. Detecting sarcasm depends not only on the literal content of an utterance but also on non-verbal cues such as speaker's tonality, facial expressions and conversational context. However, current multimodal models struggle with complex tasks like sarcasm detection, which require identifying relevant cues across modalities and pragmatically reasoning over them to infer the speaker's intention. To explore these limitations in VideoLMs, we introduce MUStReason, a diagnostic benchmark enriched with annotations of modality-specific relevant cues and underlying reasoning steps to identify sarcastic intent. In addition to benchmarking sarcasm classification performance in VideoLMs, using MUStReason we quantitatively and qualitatively evaluate the generated reasoning by disentangling the problem into perception and reasoning, we propose PragCoT, a framework that steers VideoLMs to focus on implied intentions over literal meaning, a property core to detecting sarcasm.
- Abstract(参考訳): サルカスム (Sarcasm) は特定の種類の皮肉であり、意味から何を意味するのかを識別する。
sarcasmの検出は、発話のリテラル内容だけでなく、話者のトナリティ、表情、会話の文脈といった非言語的手がかりにも依存する。
しかし、現在のマルチモーダルモデルはサルカズム検出のような複雑なタスクに苦しむため、モダリティを越えて関連する手がかりを特定し、話者の意図を推測するために実践的に推論する必要がある。
MUStReasonは、モダリティに特有な手がかりのアノテーションと、サーカシックな意図を識別するための基本的な推論手順が豊富な診断ベンチマークである。
MUStReason を用いて,その問題を認識と推論に切り離して生成した推論を定量的に定性的に評価すると共に,ビデオLM が文字通りの意味よりも示唆された意図に焦点を合わせるためのフレームワークである PragCoT を提案する。
関連論文リスト
- IRONIC: Coherence-Aware Reasoning Chains for Multi-Modal Sarcasm Detection [7.739824004160998]
IRONICはマルチモーダル・コヒーレンス・リレーション(Multi-modal Coherence Relations)を利用したインコンテキスト学習フレームワークで,参照,類似,実用的な画像テキスト・リンクの解析を行う。
実験の結果,IRONICはゼロショットマルチモーダルサーカスム検出において最先端の性能を実現することがわかった。
論文 参考訳(メタデータ) (2025-05-22T05:49:01Z) - Detecting Emotional Incongruity of Sarcasm by Commonsense Reasoning [32.5690489394632]
本論文は, 語義的意味に反する批判, モック, その他の否定的な感情を伝えるか否かを識別することを目的とした, 皮肉検出に焦点を当てた。
既存のメソッドは、複雑な現実世界のシナリオに直面した時に、常識的な推論能力に欠けており、不満足なパフォーマンスをもたらします。
本研究では,EICR と呼ばれるコモンセンス拡張に基づく不整合推論を行うサルカズム検出のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-17T11:25:55Z) - Reasoning in Conversation: Solving Subjective Tasks through Dialogue
Simulation for Large Language Models [56.93074140619464]
本稿では,対話シミュレーションによる主観的課題の解決に焦点を当てたRiC(Reasoning in Conversation)を提案する。
RiCのモチベーションは、チェーン・オブ・ソート・スタイルの合理性を提供するのではなく、対話をシミュレートすることで有用な文脈情報をマイニングすることである。
GPT-4、ChatGPT、OpenChatなど、APIベースのLLMとオープンソースのLLMの両方を12のタスクで評価する。
論文 参考訳(メタデータ) (2024-02-27T05:37:10Z) - Sentiment-enhanced Graph-based Sarcasm Explanation in Dialogue [63.32199372362483]
本稿では,SEntiment-enhanceD Graph を用いたマルチモーダルサルカズム記述フレームワーク EDGE を提案する。
特に,まずレキシコン誘導型発話感情推論モジュールを提案し,そこでは発話感情改善戦略を考案する。
次に,マルチモーダル感情分析モデル JCA を拡張し,映像音声クリップ毎に共同感情ラベルを導出することにより,JCA-SI (Joint Cross Attention-based Sentiment Inference) というモジュールを開発する。
論文 参考訳(メタデータ) (2024-02-06T03:14:46Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Sarcasm Detection Framework Using Emotion and Sentiment Features [62.997667081978825]
本研究では,感情と感情の特徴を取り入れたモデルを提案する。
我々のアプローチは、ソーシャルネットワークプラットフォームとオンラインメディアの4つのデータセットに対して、最先端の結果を得た。
論文 参考訳(メタデータ) (2022-11-23T15:14:44Z) - Multi-Modal Sarcasm Detection Based on Contrastive Attention Mechanism [7.194040730138362]
本研究では、モーダリティ間コントラストアテンションに基づくSarcasm Detection(ConAttSD)モデルを構築し、モーダリティ間コントラストアテンション機構を用いて発話のコントラスト特徴を抽出する。
ベンチマークマルチモーダルサルカズムデータセットであるMUStARDに関する実験により,提案したConAttSDモデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-09-30T14:17:51Z) - $R^3$: Reverse, Retrieve, and Rank for Sarcasm Generation with
Commonsense Knowledge [51.70688120849654]
非皮肉な入力文に基づくサルカズム生成のための教師なしアプローチを提案する。
本手法では,サルカズムの2つの主要な特徴をインスタンス化するために,検索・編集の枠組みを用いる。
論文 参考訳(メタデータ) (2020-04-28T02:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。