論文の概要: Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2509.23144v1
- Date: Sat, 27 Sep 2025 06:16:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.067461
- Title: Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence
- Title(参考訳): コーディネーションは単純化を必要とする:自然と人工知能における多目的の妥協に関する熱力学境界
- Authors: Atma Anand,
- Abstract要約: コーディネート焦点として機能する最大効用を持つ解は、精度よりもエージェント間で発見可能な選択圧力がはるかに高いことを示す。
この枠組みを熱力学的コーディネート理論 (TCT) と呼び、協調には急進的な情報損失が必要であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Information-processing systems coordinating across multiple agents and objectives face fundamental thermodynamic constraints. We show that solutions with maximum utility to act as coordination focal points have much higher selection pressure for being findable across agents rather than accuracy. We derive that the information-theoretic minimum description length of coordination protocols to precision $\varepsilon$ scales as $L(P)\geq NK\log_2 K+N^2d^2\log (1/\varepsilon)$ for $N$ agents with $d$ potentially conflicting objectives and internal model complexity $K$. This scaling forces progressive simplification, with coordination dynamics changing the environment itself and shifting optimization across hierarchical levels. Moving from established focal points requires re-coordination, creating persistent metastable states and hysteresis until significant environmental shifts trigger phase transitions through spontaneous symmetry breaking. We operationally define coordination temperature to predict critical phenomena and estimate coordination work costs, identifying measurable signatures across systems from neural networks to restaurant bills to bureaucracies. Extending the topological version of Arrow's theorem on the impossibility of consistent preference aggregation, we find it recursively binds whenever preferences are combined. This potentially explains the indefinite cycling in multi-objective gradient descent and alignment faking in Large Language Models trained with reinforcement learning with human feedback. We term this framework Thermodynamic Coordination Theory (TCT), which demonstrates that coordination requires radical information loss.
- Abstract(参考訳): 複数のエージェントや目的にまたがって協調する情報処理システムは、基本的な熱力学的制約に直面している。
コーディネート・フォーカスポイントとして機能する最大効用を持つ解は、精度よりもエージェント間で発見可能な選択圧力がはるかに高いことを示す。
調整プロトコルの情報理論的最小記述長を精度$\varepsilon$ scales as $L(P)\geq NK\log_2 K+N^2d^2\log (1/\varepsilon)$ for $N$ agent with $d$ potentially conflicting objectives and internal model complexity $K$.
このスケーリングは、調整のダイナミクスが環境そのものを変え、階層的なレベルをまたいだ最適化をシフトさせることで、進歩的な単純化を強要する。
確立された焦点から移動するには再調整が必要であり、持続的な準安定状態とヒステリシスを創出するが、そこでは大きな環境変化が自発的対称性の破れを通じて相転移を引き起こす。
我々は、ニューラルネットワークからレストランの請求書、官僚に至るまで、システム間で測定可能なシグネチャを識別し、臨界現象を予測し、調整作業コストを見積もるために調整温度を運用的に定義する。
アローの定理の位相版を一貫した選好アグリゲーションの不合理性に拡張すると、選好が組み合わされるたびに再帰的に結合する。
これは、人間からのフィードバックで強化学習を訓練した大規模言語モデルにおいて、多目的勾配勾配降下とアライメントフェイキングの不確定なサイクリングについて、潜在的に説明することができる。
この枠組みを熱力学コーディネート理論 (TCT) と呼び、協調には急進的な情報損失が必要であることを示す。
関連論文リスト
- A Unified Theory of Compositionality, Modularity, and Interpretability in Markov Decision Processes [1.3044677039636754]
我々は、新しい報酬のないマルコフ決定プロセスのためのオプションカーネルベルマン方程式(OKBE)を紹介する。
OKBEは、状態時オプションカーネル(STOK)と呼ばれる予測マップを直接構築し、最適化し、ゴールを達成する確率を最大化する。
我々は、報酬-最大化は構成性、モジュラリティ、解釈可能性の性質と矛盾していると主張する。
論文 参考訳(メタデータ) (2025-06-11T08:21:22Z) - Benchmarking LLMs' Swarm intelligence [50.544186914115045]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z) - Online Submodular Coordination with Bounded Tracking Regret: Theory,
Algorithm, and Applications to Multi-Robot Coordination [15.588080817106563]
私たちは、動的で非構造的で敵対的な環境で複数のロボットが協調する未来の自律性に動機付けられています。
本稿では,前兆を知っており,時間変化の時間的変動を考慮に入れた,有界な追従後悔を伴う最初の部分モジュラコーディネートアルゴリズムを提案する。
提案アルゴリズムは,Fisherらによるセミナル逐次グリーディアルゴリズムを予測不能な環境に一般化し,準モジュラリティとアルゴリズムを利用して,最良の専門家を追跡する。
論文 参考訳(メタデータ) (2022-09-26T05:31:34Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。