論文の概要: TEMPER: Testing Emotional Perturbation in Quantitative Reasoning
- arxiv url: http://arxiv.org/abs/2604.07801v1
- Date: Thu, 09 Apr 2026 04:52:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.70107
- Title: TEMPER: Testing Emotional Perturbation in Quantitative Reasoning
- Title(参考訳): TEMPER: 定量的推論における感情摂動の検証
- Authors: Atahan Dokme, Benjamin Reichman, Larry Heck,
- Abstract要約: 感情的フレーミングは,すべての数値的内容が保存されているにもかかわらず,精度を2~10ポイント低下させることを示した。
また、感情的変異を中和することは、失ったパフォーマンスの大半を回復させることを示す。
非感情的なパラフレーズはそのような劣化を起こさず、表面レベルの変化よりも感情的な内容に関係している。
- 参考スコア(独自算出の注目度): 5.171335396838995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models are trained and evaluated on quantitative reasoning tasks written in clean, emotionally neutral language. However, real-world queries are often wrapped in frustration, urgency or enthusiasm. Does emotional framing alone degrade reasoning when all numerical content is preserved? To investigate this, a controlled emotion translation framework is developed that rewrites problems into emotional variants while preserving all quantities and relationships. Using this framework, Temper-5400 (5,400 semantically verified emotion--neutral pairs) is constructed across GSM8K, MultiArith, and ARC-Challenge, and evaluated on eighteen models (1B to frontier scale). Two core results emerge: First, emotional framing reduces accuracy by 2-10 percentage points even though all numerical content is preserved. Second, neutralizing emotional variants recovers most of the lost performance, showing both that the degradation is tied to emotional style rather than content corruption and that neutralization can serve as a lightweight inference-time mitigation. Non-emotional paraphrases cause no such degradation, implicating emotional content rather than surface-level changes. Beyond emotion specifically, the benchmark construction procedure provides a general framework for controlled stylistic translation and robustness evaluation.
- Abstract(参考訳): 大規模言語モデルは、クリーンで感情的に中立な言語で書かれた定量的推論タスクに基づいて訓練され、評価される。
しかし、現実世界のクエリは、しばしばフラストレーション、緊急性、熱意に包まれる。
感情的なフレーミングだけでは、すべての数値が保存されているときに推論を低下させるか?
これを調べるために,すべての量と関係を保ちながら,問題を感情的な変種に書き換える制御された感情翻訳フレームワークを開発した。
このフレームワークを用いて、Temper-5400(5,400のセマンティックに検証された感情-ニュートラルペア)は、GSM8K、MultiArith、ARC-Challengeにまたがって構築され、18のモデル(1Bからフロンティアスケール)で評価される。
第一に、感情的なフレーミングは、すべての数値内容が保存されているにもかかわらず、精度を2~10ポイント削減する。
第二に、感情的な変種を中和することは、劣化がコンテンツ劣化よりも感情的なスタイルに結びついていることと、中和が軽量な推論時間緩和の役割を果たすことの両方を示す。
非感情的なパラフレーズはそのような劣化を起こさず、表面レベルの変化よりも感情的な内容に関係している。
感情以外にも、ベンチマーク構築手順は、制御されたスタイリスティックな翻訳とロバストネス評価のための一般的なフレームワークを提供する。
関連論文リスト
- Emotion Entanglement and Bayesian Inference for Multi-Dimensional Emotion Understanding [40.766332191425]
EmoSceneは4,731の文脈に富んだシナリオを8次元の感情ベクトルでアノテートした理論に基づくベンチマークである。
本稿では,感情共起統計を組み込んだ絡み合い型ベイズ推定フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-01T12:27:04Z) - FACE-net: Factual Calibration and Emotion Augmentation for Retrieval-enhanced Emotional Video Captioning [81.33341786837974]
Emotional Video Captioning (EVC) は、ビデオで表現される本質的な感情で事実を記述することを目的とした、新たなタスクである。
FActual and Emotion Augmentation (FACE-net) を用いた検索強化フレームワークを提案する。
FACE-netは、事実と感情のセマンティクスを協調的にマイニングし、生成のための適応的で正確なガイダンスを提供する。
論文 参考訳(メタデータ) (2026-03-18T07:53:15Z) - Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing [4.733799057798266]
私たちは感情を、モデルがどのようにテキストに従属し、推論するかを形作る潜在要因として研究しています。
我々は、トランスモデルにおいて、感情的なトーンが注意構造を体系的にどう変化させるかを分析する。
トレーニング中に感情条件付き表現の漂流を制限する感情正規化フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-10T05:23:18Z) - Do LLMs "Feel"? Emotion Circuits Discovery and Control [54.57583855608979]
本研究では、感情表現を引き起こす内部メカニズムと、生成したテキストにおける感情の制御について検討する。
これは、大きな言語モデルで感情回路を発見し、検証する最初の体系的な研究である。
論文 参考訳(メタデータ) (2025-10-13T12:24:24Z) - UDDETTS: Unifying Discrete and Dimensional Emotions for Controllable Emotional Text-to-Speech [61.989360995528905]
制御可能な感情的TTSのための離散的感情と次元的感情を統一する普遍的なフレームワークであるUDDETTSを提案する。
このモデルは、次元的感情記述のための解釈可能なArousal-Dominance-Valence(ADV)空間を導入し、離散的な感情ラベルまたは非線形に定量化されたADV値によって駆動される感情制御をサポートする。
実験の結果, UDDETTSは3次元の線形感情制御を実現し, エンドツーエンドの感情音声合成能力に優れていた。
論文 参考訳(メタデータ) (2025-05-15T12:57:19Z) - Fearful Falcons and Angry Llamas: Emotion Category Annotations of Arguments by Humans and LLMs [9.088303226909277]
我々は,ドイツの議論コーパスにおける感情カテゴリーの主観的アノテーションをクラウドソースし,自動ラベリング手法を評価する。
感情カテゴリーは議論における感情の予測を促進する。
すべてのプロンプト設定とモデルにおいて、自動予測は、怒りと恐怖を予測するための高いリコールだが低い精度を示す。
論文 参考訳(メタデータ) (2024-12-20T15:41:47Z) - Emotion Rendering for Conversational Speech Synthesis with Heterogeneous
Graph-Based Context Modeling [50.99252242917458]
会話音声合成(CSS)は,会話環境の中で適切な韻律と感情のインフレクションで発話を正確に表現することを目的としている。
データ不足の問題に対処するため、私たちはカテゴリと強度の点で感情的なラベルを慎重に作成します。
我々のモデルは感情の理解と表現においてベースラインモデルよりも優れています。
論文 参考訳(メタデータ) (2023-12-19T08:47:50Z) - Emotion and Sentiment Guided Paraphrasing [3.5027291542274366]
感情の勾配に沿ってきめ細かな感情的言い回しを新たに導入する。
入力テキストとターゲットテキストを微粒な感情ラベルで拡張することにより、広く使われているパラフレーズデータセットを再構築する。
本研究では,条件付きテキスト生成のための事前学習言語モデルを活用することで,感情と感情を導出するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T20:59:40Z) - Emotion Intensity and its Control for Emotional Voice Conversion [77.05097999561298]
感情音声変換(EVC)は、言語内容と話者のアイデンティティを保ちながら、発話の感情状態を変換しようとする。
本稿では,感情の強さを明示的に表現し,制御することを目的とする。
本稿では,話者スタイルを言語内容から切り離し,連続した空間に埋め込み,感情埋め込みのプロトタイプを形成するスタイルに符号化することを提案する。
論文 参考訳(メタデータ) (2022-01-10T02:11:25Z) - Emotion-aware Chat Machine: Automatic Emotional Response Generation for
Human-like Emotional Interaction [55.47134146639492]
この記事では、投稿中のセマンティクスと感情を同時にエンコードできる、未定義のエンドツーエンドニューラルネットワークを提案する。
実世界のデータを用いた実験により,提案手法は,コンテンツコヒーレンスと感情の適切性の両方の観点から,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-06-06T06:26:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。