論文の概要: Controlling Long-Horizon Behavior in Language Model Agents with Explicit State Dynamics
- arxiv url: http://arxiv.org/abs/2601.16087v1
- Date: Thu, 22 Jan 2026 16:34:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.652105
- Title: Controlling Long-Horizon Behavior in Language Model Agents with Explicit State Dynamics
- Title(参考訳): 明示的状態ダイナミクスを用いた言語モデルエージェントの長軸挙動制御
- Authors: Sukesh Subaharan,
- Abstract要約: 大規模言語モデル (LLM) エージェントは、拡張相互作用中にトーンとペルソナの急激な変化を示す。
ロングホライゾン剤の挙動形成における明示的な感情力学の役割はいまだ解明されていない。
本稿では,言語モデル外部の連続的Valence-Arousal-Dominance(VAD)状態を維持するエージェントレベル感情サブシステムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) agents often exhibit abrupt shifts in tone and persona during extended interaction, reflecting the absence of explicit temporal structure governing agent-level state. While prior work emphasizes turn-local sentiment or static emotion classification, the role of explicit affective dynamics in shaping long-horizon agent behavior remains underexplored. This work investigates whether imposing dynamical structure on an external affective state can induce temporal coherence and controlled recovery in multi-turn dialogue. We introduce an agent-level affective subsystem that maintains a continuous Valence-Arousal-Dominance (VAD) state external to the language model and governed by first- and second-order update rules. Instantaneous affective signals are extracted using a fixed, memoryless estimator and integrated over time via exponential smoothing or momentum-based dynamics. The resulting affective state is injected back into generation without modifying model parameters. Using a fixed 25-turn dialogue protocol, we compare stateless, first-order, and second-order affective dynamics. Stateless agents fail to exhibit coherent trajectories or recovery, while state persistence enables delayed responses and reliable recovery. Second-order dynamics introduce affective inertia and hysteresis that increase with momentum, revealing a trade-off between stability and responsiveness.
- Abstract(参考訳): 大規模言語モデル (LLM) エージェントは, エージェントレベルを規定する明示的な時間構造が存在しないことを反映して, 対話中のトーンやペルソナの急激な変化を示すことが多い。
以前の研究では、ターンローカルな感情や静的な感情の分類が重視されていたが、ロングホライゾンエージェントの行動形成における明示的な感情力学の役割はいまだ解明されていない。
本研究は,外的感情状態に動的構造を付与することで,マルチターン対話における時間的コヒーレンスや制御された回復を誘発できるかどうかを考察する。
本稿では,言語モデル以外の状態を維持し,一階と二階の更新ルールによって管理されるエージェントレベルの感情サブシステムを提案する。
固定されたメモリレス推定器を用いて瞬時に感情信号を抽出し、指数的滑らか化や運動量に基づくダイナミクスを通じて時間とともに統合する。
結果として生じる感情状態は、モデルパラメータを変更することなく生成に注入される。
固定された25ターン対話プロトコルを用いて、状態のない、一階、二階の感情力学を比較する。
ステートレスエージェントはコヒーレントなトラジェクトリやリカバリを示すことができず、ステート永続性は応答の遅延と信頼性の高いリカバリを可能にする。
2階の力学は、運動量とともに増加する感情的慣性やヒステリシスを導入し、安定性と応答性の間のトレードオフを明らかにする。
関連論文リスト
- Dynamical Systems Analysis Reveals Functional Regimes in Large Language Models [0.8694591156258423]
大規模言語モデルは高次元内部力学を用いてテキスト生成を行う。
ほとんどの解釈可能性のアプローチは静的表現や因果的介入に重点を置いており、時間構造はほとんど探索されていない。
本稿では,自己回帰生成中のアクティベーション時系列から計算した複合動的計量について論じる。
論文 参考訳(メタデータ) (2026-01-11T21:57:52Z) - Stable Language Guidance for Vision-Language-Action Models [62.80963701282789]
残留セマンティックステアリング(Residual Semantic Steering)は、セマンティック実行から身体的余裕を逸脱する確率的フレームワークである。
RSSは最先端の堅牢性を実現し、敵対的な言語摂動の下でも性能を維持する。
論文 参考訳(メタデータ) (2026-01-07T16:16:10Z) - Emotion-Inspired Learning Signals (EILS): A Homeostatic Framework for Adaptive Autonomous Agents [0.0]
本稿では,ロバストな自律性における非適応的要因が,高レベルなホメオスタット制御機構として機能する,生物学的感情の関数的類似性であることを示す。
EILS(Emotion-Inspired Learning Signals)は、分散最適化をコヒーレントなバイオインスパイアされた内部フィードバックエンジンに置き換える統合フレームワークである。
論文 参考訳(メタデータ) (2025-12-20T19:46:51Z) - Chronological Thinking in Full-Duplex Spoken Dialogue Language Models [66.84843878538207]
時系列思考は、完全なSDLMの応答品質を改善することを目的としている。
追加のレイテンシがない: ユーザが話すのをやめると、エージェントは考えるのをやめ、それ以上の遅延なしに話し始める。
結果: 客観的指標と人的評価の両面から, 時系列思考の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2025-10-02T10:28:11Z) - MotionGPT3: Human Motion as a Second Modality [28.616340011811843]
MotionGPT3は、理解と生成の両方のためのバイモーダルモーション言語モデルである。
共通注意を持つデュアルストリームトランスは、制御された双方向情報フローを実現しつつ、モダリティ固有の経路を保存する。
実験により、MotionGPT3はトレーニング損失の2倍高速収束、検証の最大4倍高速収束を実現している。
論文 参考訳(メタデータ) (2025-06-30T17:42:22Z) - Neural Interaction Energy for Multi-Agent Trajectory Prediction [55.098754835213995]
ニューラル・インタラクション・エナジー(MATE)によるマルチエージェント軌道予測(Multi-Agent Trajectory Prediction)というフレームワークを導入する。
MATEは神経相互作用エネルギーを用いてエージェントの対話運動を評価する。
時間的安定性を高めるために,エージェント間相互作用制約とエージェント内動作制約という2つの制約を導入する。
論文 参考訳(メタデータ) (2024-04-25T12:47:47Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z) - Isolating and Leveraging Controllable and Noncontrollable Visual
Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。
まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。
第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文 参考訳(メタデータ) (2022-05-27T08:07:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。