論文の概要: From Prediction to Justification: Aligning Sentiment Reasoning with Human Rationale via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2604.13398v1
- Date: Wed, 15 Apr 2026 01:55:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.350643
- Title: From Prediction to Justification: Aligning Sentiment Reasoning with Human Rationale via Reinforcement Learning
- Title(参考訳): 予測から正当化へ:強化学習による人間関係の感覚推論
- Authors: Shihao Zhang, Ziwei Wang, Jie Zhou, Yulan Wu, Qin Chen, Zhikai Lei, Liyang Yu, Liang Dou, Liang He,
- Abstract要約: ABSA-R1は、理由予測の認知プロセスを模倣するように設計された大規模な言語モデルフレームワークである。
我々は、生成した推論パスと最終的な感情ラベルとの一貫性を強制する認知アライメント・リワードモデル(以前の感情認識報酬モデル)を導入する。
この明示的な推論能力を持つモデルが、解釈可能性を高めるだけでなく、感情分類や三重項抽出において優れた性能をもたらすことを示す。
- 参考スコア(独自算出の注目度): 22.540816588473557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Aspect-based Sentiment Analysis (ABSA) systems have achieved high accuracy in identifying sentiment polarities, they often operate as "black boxes," lacking the explicit reasoning capabilities characteristic of human affective cognition. Humans do not merely categorize sentiment; they construct causal explanations for their judgments. To bridge this gap, we propose ABSA-R1, a large language model framework designed to mimic this ``reason-before-predict" cognitive process. By leveraging reinforcement learning (RL), ABSA-R1 learns to articulate the why behind the what, generating natural language justifications that ground its sentiment predictions. We introduce a Cognition-Aligned Reward Model (formerly sentiment-aware reward model) that enforces consistency between the generated reasoning path and the final emotional label. Furthermore, inspired by metacognitive monitoring, we implement a performance-driven rejection sampling strategy that selectively targets hard cases where the model's internal reasoning is uncertain or inconsistent. Experimental results on four benchmarks demonstrate that equipping models with this explicit reasoning capability not only enhances interpretability but also yields superior performance in sentiment classification and triplet extraction compared to non-reasoning baselines.
- Abstract(参考訳): Aspect-based Sentiment Analysis (ABSA) システムは感情極性を特定する上で高い精度を達成しているが、人間の感情認知に特徴的な明確な推論能力に欠ける「ブラックボックス」として機能することがしばしばある。
人間は単に感情を分類するだけでなく、判断の因果的説明を構成する。
このギャップを埋めるため,この「推論前」認知過程を模倣した大規模言語モデルフレームワークであるABSA-R1を提案する。
強化学習(RL)を活用することで、ABSA-R1は、その背景にある理由を明確にし、その感情予測の基礎となる自然言語の正当化を生成する。
我々は、生成した推論パスと最終的な感情ラベルとの一貫性を強制する認知アライメント・リワードモデル(以前の感情認識報酬モデル)を導入する。
さらに,メタ認知的モニタリングに触発されて,モデルの内部推論が不確実あるいは矛盾なハードケースを選択的にターゲットする,パフォーマンス駆動型拒絶サンプリング戦略を実装した。
4つのベンチマークによる実験結果から, この明示的推論能力を持つモデルが解釈可能性を高めるだけでなく, 感情分類や三重項抽出において非推論ベースラインよりも優れた性能を示すことが示された。
関連論文リスト
- ALIVE: Awakening LLM Reasoning via Adversarial Learning and Instructive Verbal Evaluation [4.265094703231012]
ハンズフリーアライメントフレームワークである textbfALIVE (emphAdrial Learning with Instructive Verbal Evaluation) を導入する。
対人学習とインストラクティブな言語フィードバックを結合することにより、ALIVEはモデルが生のコーパスから直接評価基準を内在化できるようにする。
同一のデータと計算により、ALIVEはクロスドメインの一般化を著しく改善し、自己補正率も向上した。
論文 参考訳(メタデータ) (2026-02-05T09:20:23Z) - Your Reasoning Benchmark May Not Test Reasoning: Revealing Perception Bottleneck in Abstract Reasoning Benchmarks [10.06554565520216]
認識と推論を明確に分離する2段階の実験パイプラインを導入する。
本研究は,観測性能ギャップの根底にある要因は知覚能力であることを示す。
本研究は,認識を推論から遠ざける評価プロトコルの必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-12-24T18:58:04Z) - Learning What to Attend First: Modality-Importance-Guided Reasoning for Reliable Multimodal Emotion Understanding [50.014363382140324]
モダリティ・コンパタンス(MI)は、感情に支配的なモダリティを識別するためのシンプルで効果的なメカニズムである。
MIGRは推論シーケンスを再編成し、その説明は対象の感情に対して最も重要なモダリティから始まる。
その結果、MIGRは推論信頼性を大幅に改善し、感情的に矛盾した説明を伴う正しい予測の事例を減少させることがわかった。
論文 参考訳(メタデータ) (2025-12-02T12:29:41Z) - Cognitive Foundations for Reasoning and Their Manifestation in LLMs [63.12951576410617]
大規模言語モデル(LLM)は複雑な問題を解くが、単純な変種では失敗し、人間の推論と根本的に異なるメカニズムによって正しい出力を達成することを示唆している。
我々は認知科学研究を、推論不変量、メタ認知制御、推論と知識の組織化のための表現、変換操作にまたがる28の認知要素の分類学に合成する。
複雑な問題に対して66.7%の性能向上を図り、成功構造を自動的に把握するテストタイム推論ガイダンスを開発した。
論文 参考訳(メタデータ) (2025-11-20T18:59:00Z) - Is Reasoning All You Need? Probing Bias in the Age of Reasoning Language Models [0.0]
RLM(Reasoning Language Models)は、複雑な多段階推論タスクを実行する能力によって注目を集めている。
これらの能力は信頼性の向上を約束するが、社会的バイアスに対する堅牢性への影響はまだ不明だ。
我々は, CLEAR-Bias ベンチマークを用いて, RLM のバイアス誘発に対する対角的ロバスト性について検討する。
論文 参考訳(メタデータ) (2025-07-03T17:01:53Z) - Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training [86.70255651945602]
我々はReinforcecing Cognitive Experts(RICE)と呼ばれる新しい推論時ステアリング手法を導入する。
RICEは、追加のトレーニングや複雑化なしに推論のパフォーマンスを改善することを目的としている。
先行する MoE ベースの LRM を用いた経験的評価は、推論精度、認知効率、ドメイン間の一般化において顕著で一貫した改善を示す。
論文 参考訳(メタデータ) (2025-05-20T17:59:16Z) - Application of Multiple Chain-of-Thought in Contrastive Reasoning for Implicit Sentiment Analysis [1.9472869221587836]
暗黙の感情分析は、微妙に表現された感情を明らかにすることを目的としており、曖昧さと比喩的な言語によってしばしば隠蔽される。
本稿では、暗黙の感情分析の性能を高めるために、新しい2元逆連鎖推論フレームワークを提案する。
また、ランダム仮説の限界に対処する三重逆連鎖推論フレームワークも導入する。
論文 参考訳(メタデータ) (2025-03-10T10:10:50Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - Learning Causal Semantic Representation for Out-of-Distribution
Prediction [125.38836464226092]
因果推論に基づく因果意味生成モデル(CSG)を提案し,その2つの要因を別々にモデル化する。
CSGはトレーニングデータに適合させることで意味的因子を識別できることを示し、この意味的識別はOOD一般化誤差の有界性を保証する。
論文 参考訳(メタデータ) (2020-11-03T13:16:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。