論文の概要: How Intelligence Emerges: A Minimal Theory of Dynamic Adaptive Coordination
- arxiv url: http://arxiv.org/abs/2603.11560v1
- Date: Thu, 12 Mar 2026 05:28:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.91135
- Title: How Intelligence Emerges: A Minimal Theory of Dynamic Adaptive Coordination
- Title(参考訳): インテリジェンスの創出 : 動的適応コーディネーションの最小理論
- Authors: Stefano Grassi,
- Abstract要約: 本稿では,マルチエージェントシステムにおける適応調整理論について述べる。
永続環境は蓄積された調整信号を記憶し、分散インセンティブフィールドはこれらの信号を局所的に送信し、適応エージェントは応答を更新する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper develops a dynamical theory of adaptive coordination in multi-agent systems. Rather than analyzing coordination through equilibrium optimization or agent-centric learning alone, the framework models agents, incentives, and environment as a recursively closed feedback architecture. A persistent environment stores accumulated coordination signals, a distributed incentive field transmits those signals locally, and adaptive agents update in response. Coordination is thus treated as a structural property of coupled dynamics rather than as the solution to a centralized objective. The paper establishes three structural results. First, under dissipativity assumptions, the induced closed-loop system admits a bounded forward-invariant region, ensuring viability without requiring global optimality. Second, when incentive signals depend non-trivially on persistent environmental memory, the resulting dynamics generically cannot be reduced to a static global objective defined solely over the agent state space. Third, persistent environmental state induces history sensitivity unless the system is globally contracting. A minimal linear specification illustrates how coupling, persistence, and dissipation govern local stability and oscillatory regimes through spectral conditions on the Jacobian. The results establish structural conditions under which intelligent coordination dynamics emerge from incentive-mediated adaptive interaction within a persistent environment, without presuming welfare maximization, rational expectations, or centralized design.
- Abstract(参考訳): 本稿では,マルチエージェントシステムにおける適応調整の動的理論について述べる。
均衡最適化やエージェント中心学習だけで調整を分析するのではなく、フレームワークはエージェント、インセンティブ、環境を再帰的にクローズドなフィードバックアーキテクチャとしてモデル化する。
永続環境は蓄積された調整信号を記憶し、分散インセンティブフィールドはこれらの信号を局所的に送信し、適応エージェントは応答を更新する。
したがって、コーディネーションは集中的な目的への解というよりも、結合力学の構造的性質として扱われる。
本論文は3つの構造的結果を確立する。
第一に、分離性仮定の下では、誘導閉ループ系は有界な前方不変領域を認め、大域的最適性を必要としない生存性を保証する。
第二に、インセンティブ信号が永続的な環境記憶に非自明に依存する場合、結果として得られるダイナミクスは、エージェント状態空間にのみ定義された静的な大域的目的に還元できない。
第3に、持続的な環境状態は、システムがグローバルに収縮しない限り、履歴感度を誘導する。
最小限の線形仕様は、ジャコビアン上のスペクトル条件を通して、結合、持続、散逸が局所安定性と振動状態をどのように支配するかを示す。
その結果、知的協調のダイナミクスが、福祉の最大化、合理的な期待、集中設計を前提とせず、永続的な環境におけるインセンティブを介する適応的相互作用から生じる構造的条件を確立した。
関連論文リスト
- Harnessing Implicit Cooperation: A Multi-Agent Reinforcement Learning Approach Towards Decentralized Local Energy Markets [41.99844472131922]
分散エージェントは、明示的なピアツーピア通信なしで、ローカルエネルギー市場における最適調整を近似することができる。
スティグマイシンシグナリングは複雑なグリッドコーディネートに十分なコンテキストを提供し、高価な集中型通信インフラに代わる堅牢でプライバシー保護の代替を提供する。
論文 参考訳(メタデータ) (2026-02-17T22:22:32Z) - Position: Agentic Evolution is the Path to Evolving LLMs [56.733933092220845]
この制限に対処するには、新たなスケーリング軸進化が必要です。
既存の展開時適応手法では、障害を診断し、持続的な改善を生み出すために必要な戦略的機関が欠如している。
論文 参考訳(メタデータ) (2026-01-30T22:15:58Z) - PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution [64.15555230987222]
PACEvolveはエージェントのコンテキストと検索ダイナミクスを堅牢に管理するように設計されたフレームワークである。
PACEvolveは、一貫性のある長期自己改善のための体系的なパスを提供する。
論文 参考訳(メタデータ) (2026-01-15T18:25:23Z) - Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence [0.0]
コーディネート・フォーカスポイントとして機能する最大効用を持つ解は、精度よりもエージェント間で発見可能な選択圧力がはるかに高いことを示す。
この枠組みを熱力学的コーディネート理論 (TCT) と呼び、協調には急進的な情報損失が必要であることを示す。
論文 参考訳(メタデータ) (2025-09-27T06:16:56Z) - Embodied World Models Emerge from Navigational Task in Open-Ended Environments [5.785697934050656]
プロシージャ的に生成された平面迷路を解決するために,スパース報酬のみで訓練された反復エージェントが,方向,距離,障害物レイアウトなどの計量概念を自律的に内部化できるかどうかを問う。
トレーニングの後、エージェントは、下層の空間モデルにヒントを与える行動である、見えない迷路において、常に準最適経路を生成する。
論文 参考訳(メタデータ) (2025-04-15T17:35:13Z) - Allostatic Control of Persistent States in Spiking Neural Networks for perception and computation [79.16635054977068]
本稿では,アロスタシスの概念を内部表現の制御に拡張することにより,環境に対する知覚的信念を更新するための新しいモデルを提案する。
本稿では,アトラクタネットワークにおける活動の急増を空間的数値表現として利用する数値認識の応用に焦点を当てる。
論文 参考訳(メタデータ) (2025-03-20T12:28:08Z) - Stateful active facilitator: Coordination and Environmental
Heterogeneity in Cooperative Multi-Agent Reinforcement Learning [71.53769213321202]
環境の調整レベルと不均一度の概念を定式化する。
異なるMARLアプローチの実証評価を容易にするマルチエージェント環境のスイートであるHECOGridを提案する。
本研究では,エージェントが高配向環境と高配向環境において効率的に作業することを可能にする訓練分散実行学習手法を提案する。
論文 参考訳(メタデータ) (2022-10-04T18:17:01Z) - Dynamic Regret of Policy Optimization in Non-stationary Environments [120.01408308460095]
我々は,POWERとPOWER++の2つのモデルフリーポリシー最適化アルゴリズムを提案し,その動的後悔の保証を確立する。
我々はPOWER++が動的後悔の第2の構成要素であるPOWERよりも優れており、予測によって非定常性に積極的に適応していることを示す。
我々の知識を最大限に活用するために、我々の研究は、非定常環境におけるモデルフリーなRLアルゴリズムの、最初の動的後悔分析である。
論文 参考訳(メタデータ) (2020-06-30T23:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。