論文の概要: Emotion-Inspired Learning Signals (EILS): A Homeostatic Framework for Adaptive Autonomous Agents
- arxiv url: http://arxiv.org/abs/2512.22200v1
- Date: Sat, 20 Dec 2025 19:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:29.880051
- Title: Emotion-Inspired Learning Signals (EILS): A Homeostatic Framework for Adaptive Autonomous Agents
- Title(参考訳): 感情刺激型学習信号(EILS):適応型自律エージェントのためのホメオスタティックフレームワーク
- Authors: Dhruv Tiwari,
- Abstract要約: 本稿では,ロバストな自律性における非適応的要因が,高レベルなホメオスタット制御機構として機能する,生物学的感情の関数的類似性であることを示す。
EILS(Emotion-Inspired Learning Signals)は、分散最適化をコヒーレントなバイオインスパイアされた内部フィードバックエンジンに置き換える統合フレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ruling method in modern Artificial Intelligence spanning from Deep Reinforcement Learning (DRL) to Large Language Models (LLMs) relies on a surge of static, externally defined reward functions. While this "extrinsic maximization" approach has rendered superhuman performance in closed, stationary fields, it produces agents that are fragile in open-ended, real-world environments. Standard agents lack internal autonomy: they struggle to explore without dense feedback, fail to adapt to distribution shifts (non-stationarity), and require extensive manual tuning of static hyperparameters. This paper proposes that the unaddressed factor in robust autonomy is a functional analog to biological emotion, serving as a high-level homeostatic control mechanism. We introduce Emotion-Inspired Learning Signals (EILS), a unified framework that replaces scattered optimization heuristics with a coherent, bio-inspired internal feedback engine. Unlike traditional methods that treat emotions as semantic labels, EILS models them as continuous, homeostatic appraisal signals such as Curiosity, Stress, and Confidence. We formalize these signals as vector-valued internal states derived from interaction history. These states dynamically modulate the agent's optimization landscape in real time: curiosity regulates entropy to prevent mode collapse, stress modulates plasticity to overcome inactivity, and confidence adapts trust regions to stabilize convergence. We hypothesize that this closed-loop homeostatic regulation can enable EILS agents to outperform standard baselines in terms of sample efficiency and non-stationary adaptation.
- Abstract(参考訳): 深層強化学習(DRL)から大規模言語モデル(LLM)まで、現代の人工知能における支配手法は、静的で外部的に定義された報酬関数の急増に依存している。
この「外在的最大化」アプローチは、クローズドで静止したフィールドにおいて超人的性能を低下させたが、オープンエンドの現実世界環境では脆弱なエージェントを生み出す。
標準エージェントは内部の自律性に欠けており、密集したフィードバックなしで探索するのに苦労し、分散シフト(非定常性)に適応できず、静的ハイパーパラメータの広範囲な手動チューニングを必要としている。
本稿では,ロバストな自律性における非適応的要因が,高レベルなホメオスタット制御機構として機能する,生物学的感情の関数的類似性であることを示す。
EILS(Emotion-Inspired Learning Signals)は、分散最適化ヒューリスティックスを、一貫性のあるバイオインスパイアされた内部フィードバックエンジンに置き換える統合フレームワークである。
感情をセマンティックなラベルとして扱う伝統的な方法とは異なり、EILSはそれらをキュリオシティ、ストレス、信頼といった恒常的な評価信号としてモデル化する。
我々はこれらの信号を相互作用履歴から得られるベクトル値内部状態として定式化する。
これらの状態はエージェントの最適化環境をリアルタイムで動的に変調する:好奇心はモード崩壊を防ぐためにエントロピーを規制し、ストレスは不活性を克服するために可塑性を変調し、信頼度は信頼領域に適応して収束を安定させる。
我々は、この閉ループホメオスタティック・レギュレーションにより、サンプル効率と非定常適応の観点から、EILSエージェントが標準ベースラインより優れていると仮定する。
関連論文リスト
- The Silent Scholar Problem: A Probabilistic Framework for Breaking Epistemic Asymmetry in LLM Agents [0.6117371161379209]
本稿では,エージェントに双方向知識交換のための非構造的動機を与える形式的確率的枠組みを提案する。
これらの蓄積された信念状態が、人間フィードバックからの強化学習(RLHF)と監視ファインチューニング(SFT)のための高品質データフィルタの検証可能な報酬信号としてどのように機能するかを示す。
シミュレーションの結果、この不確実性駆動型戦略が異種環境におけるランダムベースラインを著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-12-24T02:02:25Z) - Disentangling Emotional Bases and Transient Fluctuations: A Low-Rank Sparse Decomposition Approach for Video Affective Analysis [28.120677578256366]
ビデオベースのAffective Computing(VAC)は、複雑な感情力学によるモデル不安定性と表現的劣化に悩まされている。
本稿では,LowRank Sparse Emotion Understanding Framework (LSEF)を提案する。
LSEFは3つのプラグ・アンド・プレイモジュールを用いており、このモジュールは階層的な低ランクスパース構成過程として感情力学を歪めている。
論文 参考訳(メタデータ) (2025-11-14T15:35:11Z) - SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。
大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。
本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文 参考訳(メタデータ) (2025-10-20T19:53:02Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z) - AgentZero++: Modeling Fear-Based Behavior [4.783433971864009]
我々は,集団暴力をシミュレートするための認知,感情,社会的メカニズムを統合したエージェントベースモデルであるAgentZero++を提案する。
EpsteinのAgent_Zeroフレームワークをベースにして、8つの振る舞い拡張でオリジナルのモデルを拡張します。
これらの追加により、エージェントは内部の状態、以前の経験、社会的フィードバックに基づいて適応できる。
論文 参考訳(メタデータ) (2025-10-05T22:33:56Z) - ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [51.07970070817353]
理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。
現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。
本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文 参考訳(メタデータ) (2025-08-19T12:13:41Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Stabilizing Transformer Training by Preventing Attention Entropy
Collapse [56.45313891694746]
本研究は,トランスフォーマーのトレーニングダイナミクスについて,注目層の進化について検討する。
我々は、$sigma$Reparamが注意層におけるエントロピー崩壊を防ぎ、より安定したトレーニングを促進することを示す。
画像分類、画像自己教師型学習、機械翻訳、音声認識、言語モデリングタスクについて、$sigma$Reparamで実験を行った。
論文 参考訳(メタデータ) (2023-03-11T03:30:47Z) - Continuous Homeostatic Reinforcement Learning for Self-Regulated
Autonomous Agents [0.0]
本研究では,恒常的強化学習理論を空間的・時間的連続環境に拡張することを提案する。
生物に豊富に存在する自己制御機構にインスパイアされ、エージェントの内部状態のダイナミクスのモデルも導入する。
論文 参考訳(メタデータ) (2021-09-14T11:03:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。