論文の概要: Learning Robust Pair Confidence for Multimodal Emotion-Cause Pair Extraction
- arxiv url: http://arxiv.org/abs/2606.18893v1
- Date: Wed, 17 Jun 2026 10:12:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.112274
- Title: Learning Robust Pair Confidence for Multimodal Emotion-Cause Pair Extraction
- Title(参考訳): マルチモーダル感情型ペア抽出のためのロバストペア信頼度学習
- Authors: Zhuangzhuang Pan, Ning Dong, Yingna Su, Yan Xia,
- Abstract要約: ペア信頼学習のためのトレーニング専用フレームワークであるRPCL(Robust Pair Confidence Learning)を提案する。
RPCLは、ペアの信頼性を差別的かつ安定したものにする。
ECF、MECAD、MEC4では、RPCLはマッチングベースモデルよりも3シード平均ペアF1を2.58〜2.83ポイント改善する。
- 参考スコア(独自算出の注目度): 7.137049780535421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal emotion-cause pair extraction (MECPE) requires reliable pair confidence over candidate pairs. Existing pair scorers commonly use pair-level cross entropy over valid candidates, which treats links mostly independently. This leaves the relative confidence geometry among competing causes under-constrained, allowing gold pairs to stay close to hard negatives or rely on incidental non-gold context. We study this vulnerability as pair-confidence brittleness and propose RPCL (Robust Pair Confidence Learning), a training-only framework for pair-confidence learning. RPCL encourages pair confidence to be both discriminative and stable: gold pairs are separated from row-wise hard negatives through a confidence-difference margin constraint, and clean pair predictions are aligned with predictions from a corrupted view where non-gold contextual utterance representations are partially corrupted. The original clean pair scorer and decoding pipeline are used unchanged at inference time. On ECF, MECAD, and MEC4, RPCL improves the three-seed mean Pair F1 over a matched base model by 2.58 to 2.83 percentage points in the full text-audio-video setting, and improves mean Pair AUPRC on all three datasets. Diagnostic analysis further shows larger gold-negative confidence gaps and lower margin-violation severity. These results suggest that explicitly shaping pair confidence is an effective training strategy for MECPE.
- Abstract(参考訳): マルチモーダル感情-ペア抽出(MECPE)では、候補ペアに対する信頼度が要求される。
既存のペアスコアラーでは、有効候補に対するペアレベルのクロスエントロピーが一般的であり、主に独立してリンクを扱う。
このことは、競合する原因の相対的信頼度を過度に制限し、金対が強陰性に近づいたり、偶発的な非金の文脈に依存することを可能にする。
本稿では、この脆弱性をペア信頼の脆さとして研究し、ペア信頼学習のためのトレーニング専用のフレームワークであるRPCL(Robust Pair Confidence Learning)を提案する。
RPCLは、ペアの信頼度と安定性の両方を奨励する:ゴールドペアは、信頼差の限界制約によって行方向に硬い負から分離され、クリーンペアの予測は、非ゴールドの文脈的発話表現が部分的に破損している腐敗した視点からの予測と一致している。
元のクリーンペアスコアラと復号パイプラインは、推論時に変化なく使用される。
ECF、MECAD、MEC4では、RPCLはマッチしたベースモデルで平均ペアF1を2.58~2.83ポイント改善し、平均ペアAUPRCを3つのデータセットで改善する。
診断学的には、金負の信頼ギャップが大きく、マージン違反の重症度も低い。
これらの結果は,ペア信頼を明示的に形成することがMECPEの効果的なトレーニング戦略であることを示唆している。
関連論文リスト
- Multiagent Protocols with Aggregated Confidence Signals [7.128020779227392]
信頼は、自然言語処理(NLP)における信頼性、監視、および下流決定タスクに使用される。
以前の作業では、メッセージの重み付け、議論のトリガー、個々のエージェントの校正に、マルチエージェント討論(MAD)内での信頼性を使用していた。
まず、まず、生の信頼信号を変換してモデル間で比較し、ソフト投票や確率融合によって組み合わせることで、最終的な回答を生成する3つのプロトコルを紹介します。
論文 参考訳(メタデータ) (2026-06-11T17:12:11Z) - Enhancing LLM Metacognition via Cognitive Pairwise Training [56.19495984013656]
検証可能な報酬を伴う強化学習は、証拠や推論が信頼できない場合に、モデルが自信を持って回答する意思を増す。
既存のSFT法やRL法は、主にLLMに対して応答レベルでの不確実性を拒否または表現するよう教えている。
本稿では,認知的中級アライメント段階である認知的ペアワイズトレーニング(CPT)を提案する。
論文 参考訳(メタデータ) (2026-05-30T19:53:19Z) - Ranking-Aware Calibration for Reliable Multimodal Reinforcement Learning [28.00739954235118]
本稿では,2つの比較信号を用いて信頼度を監督する学習時間フレームワークであるRanding-Aware(RAC)を紹介する。
我々はQwen2.5-VL InternVL-3.5バックボーン上でRACをインスタンス化し、クリーンで破損した入力の下で6つのマルチモーダル推論ベンチマークで評価する。
論文 参考訳(メタデータ) (2026-05-16T13:51:29Z) - Confidence-Aware Alignment Makes Reasoning LLMs More Reliable [65.44962502963378]
CASPOは、トークンレベルの信頼度とステップワイドな論理的正しさを、個別の報酬モデルをトレーニングせずに整合させるフレームワークである。
推論中、信頼を意識した思考(CaT)を提案し、不確実な推論枝を無視可能なO(V)レイテンシで動的に生成する。
10のベンチマークと複数のモデルファミリでの実験では、CASPOは推論の信頼性と推論効率を一貫して改善している。
論文 参考訳(メタデータ) (2026-05-08T07:08:25Z) - Process Supervision of Confidence Margin for Calibrated LLM Reasoning [52.373121066425455]
強化学習(RL)によるテスト時間計算のスケーリングは,大規模言語モデル(LLM)推論能力を向上させるための信頼性の高い経路として登場した。
しかし、結果に基づく報酬は、しばしばモデルに過信感を与え、幻覚、信頼できない信頼ベースの制御、不要な計算割り当てをもたらす。
本稿では,信頼性と信頼性を両立させるキャリブレーションを意識したRLフレームワークであるReinforcement Learning with Confidence Margin(textbfRLCM)を紹介する。
論文 参考訳(メタデータ) (2026-04-25T14:40:13Z) - Epistemic Context Learning: Building Trust the Right Way in LLM-Based Multi-Agent Systems [94.9141394384021]
マルチエージェントシステムの個々のエージェントは、しばしば堅牢性を欠き、誤解を招く仲間に盲目的に適合する傾向にある。
この弱点は, 相互信頼度を評価する能力の欠如に起因していると考えられる。
まず,歴史認識参照の学習問題を定式化し,ピア間の歴史的相互作用を付加的な入力として導入する。
次に,歴史的に構築されたピアプロファイルの予測を行うための推論フレームワークであるEcestemic Context Learning (ECL) を開発した。
論文 参考訳(メタデータ) (2026-01-29T13:59:32Z) - Trust, Don't Trust, or Flip: Robust Preference-Based Reinforcement Learning with Multi-Expert Feedback [2.4352490146713364]
マルチエキスパートの選好フィードバックから共有報酬モデルと専門家固有の信頼パラメータを共同で学習する統合フレームワークであるTriTrust-PBRLを紹介する。
TTPは最先端のロバスト性を実現し、敵対的腐敗下では概日光性能を維持し、標準のPBRL法は破滅的に失敗する。
論文 参考訳(メタデータ) (2026-01-26T18:21:48Z) - Flip-Flop Consistency: Unsupervised Training for Robustness to Prompt Perturbations in LLMs [2.125148574616104]
大規模言語モデル(LLM)は、しばしば同じプロンプトの異なる言い回しに直面したときに矛盾する答えを生成する。
Flip-Flop Consistency(F2C$)を提案する。
提案手法は4つのNLPタスクにまたがる11のデータセットに対して,データセット毎に4~15のばらつきが生じる。
論文 参考訳(メタデータ) (2025-10-16T02:54:01Z) - TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them [58.04324690859212]
自動評価器(LLM-as-a-judge)としての大規模言語モデル(LLM)は、現在の評価フレームワークにおいて重大な矛盾を明らかにしている。
スコア比較不整合とペアワイズ・トランジティビティ不整合という2つの基本的不整合を同定する。
我々は2つの重要なイノベーションを通じてこれらの制限に対処する確率的フレームワークであるTrustJudgeを提案する。
論文 参考訳(メタデータ) (2025-09-25T13:04:29Z) - Confidence-Aware Routing for Large Language Model Reliability Enhancement: A Multi-Signal Approach to Pre-Generation Hallucination Mitigation [0.0]
大規模言語モデルは幻覚に悩まされ、可視だが事実的に誤った内容を生成する。
現在の緩和戦略は、計算コストが高く、信頼性の低いコンテンツ生成を防げない、ポストジェネレーション補正に重点を置いている。
本稿では,予測された信頼性に基づいて,モデルの不確実性を積極的に評価し,クエリをリダイレクトする信頼度対応ルーティングシステムを提案する。
論文 参考訳(メタデータ) (2025-09-23T18:34:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。