論文の概要: Multilingual Sentiment Aware Text Summarization A Reinforcement Learning Approach for Consistency Maintenance
- arxiv url: http://arxiv.org/abs/2606.08940v1
- Date: Mon, 08 Jun 2026 02:36:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.577023
- Title: Multilingual Sentiment Aware Text Summarization A Reinforcement Learning Approach for Consistency Maintenance
- Title(参考訳): 多言語感性を考慮したテキスト要約 : 一貫性維持のための強化学習アプローチ
- Authors: Mikhail Krasitskii, Alexander Gelbukh, Olga Kolesnikova, Grigori Sidorov,
- Abstract要約: 我々は、RLHFに基づく要約出力における中性感情への体系的なシフトである感情の漂流を研究する。
以上の結果から,KL正則化強度の増大に伴い,感情の漂流はより強くなる一貫した現象であることが示唆された。
感傷的トークンの制約を選択的に低減するKL正規化項の感傷的修正を提案する。
- 参考スコア(独自算出の注目度): 46.49327788332846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement Learning from Human Feedback (RLHF) has significantly improved the quality and fluency of large language models in text summarization. However, its impact on affective properties remains insufficiently understood. In this work, we study sentiment drift, a systematic shift toward neutral sentiment in RLHF-based summarization outputs compared to source texts. We conduct extensive experiments across multiple datasets, model architectures, and eight languages to analyze how alignment objectives influence sentiment preservation. Our results show that sentiment drift is a consistent phenomenon that becomes stronger with increased KL regularization strength, indicating a trade-off between alignment stability and affective fidelity. To explain this behavior, we introduce a Policy Attribution framework that decomposes the RLHF objective and quantifies the contribution of its components. Our analysis reveals that KL regularization is the primary driver of sentiment suppression across all settings. Based on these findings, we propose a sentiment-aware modification of the KL regularization term, which selectively reduces constraints on sentiment-bearing tokens. Empirical results demonstrate that this approach mitigates sentiment drift while maintaining summarization quality. Overall, our findings highlight a fundamental limitation of current alignment methods: while they improve factual consistency and safety, they may unintentionally suppress emotional expressiveness. This motivates the development of alignment strategies that explicitly account for affective preservation.
- Abstract(参考訳): Reinforcement Learning from Human Feedback (RLHF) は、テキスト要約における大規模言語モデルの質と頻度を大幅に改善した。
しかし、その感情特性への影響は未だ十分に理解されていない。
本研究では、RLHFに基づく要約出力における中性感情への体系的なシフトである感情の漂流について、原文と比較して検討する。
複数のデータセット、モデルアーキテクチャ、および8つの言語にわたる広範な実験を行い、アライメント目的が感情保存に与える影響を分析する。
以上の結果から,感情ドリフトはKL正則化強度の増大とともに強くなる一貫した現象であり,アライメント安定性と感情的忠実度とのトレードオフが示唆された。
この振る舞いを説明するために、RLHFの目的を分解し、その構成要素の貢献を定量化する政策属性フレームワークを導入する。
分析の結果、KL正則化がすべての設定において感情抑制の主要因であることが判明した。
これらの結果に基づき、感傷的トークンの制約を選択的に低減するKL正規化項の感傷的修正を提案する。
実験結果から, 要約品質を維持しつつ, 感情の漂流を軽減できることが示唆された。
全体としては、現在のアライメント手法の基本的な制限が強調され、事実の一貫性と安全性が向上する一方で、感情的な表現性を意図せず抑制する可能性がある。
このことは、感情の保存を明示的に説明するアライメント戦略の発展を動機付けている。
関連論文リスト
- Perception Without Engagement: Dissecting the Causal Discovery Deficit in LMMs [68.58207076756237]
本稿では,結果評価からメカニズム診断へ移行する摂動に基づく評価プロトコルProCauEvalを紹介する。
因果推論において,ビデオコンテンツは体系的に過小評価されている。
教師のネガティブなアライメントに基づく強化学習フレームワークであるADPOを提案する。
論文 参考訳(メタデータ) (2026-05-10T08:48:58Z) - Concrete Jungle: Towards Concreteness Paved Contrastive Negative Mining for Compositional Understanding [10.95036747579563]
ビジョンランゲージモデル(Vision-Language Models)は、優れた能力を示すが、しばしば構成的推論に苦しむ。
本研究は, 陰性試料有効性の基本的な決定因子として, 語彙的特異性を確立した。
Slipformと名付けられた統合フレームワークは、様々な構成評価ベンチマークで最先端の精度を実現している。
論文 参考訳(メタデータ) (2026-04-14T21:28:46Z) - Identifying Influential N-grams in Confidence Calibration via Regression Analysis [53.95767806659635]
回帰法を適用することにより,言語表現が信頼とどのような関係があるかを明らかにする。
我々は,大言語モデル (LLM) が推論に関わる場合,過度に信頼されていることを示す。
性能低下を伴わずに過信表現を単純に抑えることで、信頼度校正が可能であることを明らかにした。
論文 参考訳(メタデータ) (2026-04-07T11:58:49Z) - Multi-refined Feature Enhanced Sentiment Analysis Using Contextual Instruction [15.348505859065689]
CISEA-MRFEは、文脈指示(CI)、意味強化強化(SEA)、多精細特徴抽出(MRFE)を統合したPLMベースのフレームワークである。
CISEA-MRFEは強いベースラインを一貫して上回り、IMDbで4.6%、Yelpで6.5%、Twitterで30.3%、Amazonで4.1%の精度で相対的に改善されている。
これらの結果は,様々な領域にまたがる感情分類のためのアプローチの有効性と一般化能力について検証した。
論文 参考訳(メタデータ) (2025-11-01T12:46:33Z) - Facts in Stats: Impacts of Pretraining Diversity on Language Model Generalization [33.5861323022684]
本稿では,ジェネリックトークンの統計ストリームと,ソースとターゲットのトークンペアの抽象的な事実ストリームを組み合わせたフレキシブルな合成テストベッドを提案する。
文脈的多様性の増大は分布内分布(ID)の精度を低下させるが、分布外分布(OOD)の一般化に対する影響は文脈的構造に大きく依存する。
論文 参考訳(メタデータ) (2025-10-17T17:58:01Z) - Enhanced Sentiment Interpretation via a Lexicon-Fuzzy-Transformer Framework [0.9558392439655014]
本稿では,ルールベース,文脈深層学習,ファジィ論理を組み合わせた新しい語彙ファジィ変換フレームワークを提案する。
このフレームワークは4つのドメイン固有のデータセットで厳格に評価されている。
その結果、ユーザー評価との整合性が向上し、感情的極端の識別が向上し、誤分類が減少した。
論文 参考訳(メタデータ) (2025-10-17T17:36:05Z) - Grounding Long-Context Reasoning with Contextual Normalization for Retrieval-Augmented Generation [57.97548022208733]
キー値抽出における表面的選択が精度と安定性のシフトを引き起こすことを示す。
生成前の文脈表現を適応的に標準化する戦略であるコンテキスト正規化を導入する。
論文 参考訳(メタデータ) (2025-10-15T06:28:25Z) - Model-Agnostic Sentiment Distribution Stability Analysis for Robust LLM-Generated Texts Detection [23.153044933861988]
大規模言語モデル(LLM)生成テキストを検出するためのモデルに依存しないフレームワークであるSentiDetectを提案する。
本手法は, LLM出力が感情的一貫したパターンを示す傾向を示すのに対して, 人文テキストの方が感情的多様性が高いという経験的観察に動機付けられている。
我々は,Gemini-1.5-Pro,Claude-3,GPT-4-0613,LLaMa-3.3を含む5種類の多種多様なLLMを用いてSentiDetectを評価した。
論文 参考訳(メタデータ) (2025-08-09T09:55:47Z) - Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment
Analysis [56.84237932819403]
本稿では,OODの高次一般化に対するテキストモダリティの悪影響を推定・緩和することを目的とする。
そこで本研究では,マルチモーダル感情分析のためのモデルに依存しない反現実的フレームワークを考案した。
論文 参考訳(メタデータ) (2022-07-24T03:57:40Z) - Balancing Robustness and Sensitivity using Feature Contrastive Learning [95.86909855412601]
堅牢性を促進する方法は、希少なパターンや表現不足パターンに対するモデルの感受性を損なう可能性がある。
本稿では,より高次文脈的有用性を持つ機能に対して,モデルにより敏感な特徴を与える機能コントラスト学習(FCL)を提案する。
論文 参考訳(メタデータ) (2021-05-19T20:53:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。