論文の概要: A General Equilibrium Theory of Orchestrated AI Agent Systems
- arxiv url: http://arxiv.org/abs/2602.21255v1
- Date: Mon, 23 Feb 2026 13:21:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.557191
- Title: A General Equilibrium Theory of Orchestrated AI Agent Systems
- Title(参考訳): オーケストレーションAIエージェントシステムの一般均衡理論
- Authors: Jean-Philippe Garnier,
- Abstract要約: 我々は,大規模言語モデル (LLM) エージェントを集中的オーケストレーションの下で動作させるシステムに対して,一般均衡理論を確立する。
機能的ワラスの法則は定理として成り立つ: 機能的過剰需要の値は、建設による消費者の予算制約の結果として、すべての価格に対してゼロである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We establish a general equilibrium theory for systems of large language model (LLM) agents operating under centralized orchestration. The framework is a production economy in the sense of Arrow-Debreu (1954), extended to infinite-dimensional commodity spaces following Bewley (1972). Each LLM agent is modeled as a firm whose production set Y a $\subset$ H = L 2 ([0, T ], R R ) represents the feasible metric trajectories determined by its frozen model weights. The orchestrator is the consumer, choosing a routing policy over the agent DAG to maximize system welfare subject to a budget constraint evaluated at functional prices p $\in$ H A . These prices-elements of the Hilbert dual of the commodity space-assign a shadow value to each metric of each agent at each instant. We prove, via Brouwer's theorem applied to a finitedimensional approximation V K $\subset$ H, that every such economy admits at least one general equilibrium (p * , y * , $π$ * ). A functional Walras' law holds as a theorem: the value of functional excess demand is zero for all prices, as a consequence of the consumer's budget constraint-not by construction. We further establish Pareto optimality (First Welfare Theorem), decentralizability of Pareto optima (Second Welfare Theorem), and uniqueness with geometric convergence under a contraction condition (Banach). The orchestration dynamics constitute a Walrasian t{â}tonnement that converges globally under the contraction condition, unlike classical t{â}tonnement (Scarf, 1960). The framework admits a DSGE interpretation with SLO parameters as policy rates.
- Abstract(参考訳): 我々は,大規模言語モデル (LLM) エージェントを集中的オーケストレーションの下で動作させるシステムに対して,一般均衡理論を確立する。
このフレームワークはArrow-Debreu (1954) という意味で生産経済であり、Bewley (1972) に続く無限次元のコモディティ空間に拡張されている。
各LSMエージェントは、生産集合 Y a $\subset$ H = L 2 ([0, T ], R R ) が凍結モデル重みによって決定される可能な計量軌跡を表す会社としてモデル化される。
オーケストレータは消費者であり、機能価格p$$$$\in$HAで評価された予算制約の対象となるシステム福祉を最大化するために、エージェントDAGよりもルーティングポリシーを選択する。
商品空間のヒルベルト双対のこれらの価格要素は、各瞬間に各エージェントの計量に影値を割り当てる。
ブロウワーの定理を有限次元近似 V K $\subset$ H に適用することにより、そのような経済は少なくとも1つの一般均衡(p * , y * , $π$ * )を許容することを示した。
機能的ワラスの法則は定理として成り立つ: 機能的過剰需要の値は、建設による消費者の予算制約の結果として、すべての価格に対してゼロである。
さらに,パレート最適性(第1次福祉理論),パレート最適性(第2次福祉理論)の分散性,および縮退条件(バナッハ)の下での幾何収束による特異性を確立する。
オーケストレーション力学は、古典的な t{â}tonnement (Scarf, 1960) とは異なり、世界中の収縮条件下で収束するワラシア t{â}tonnement を構成する。
このフレームワークは、SLOパラメータをポリシーレートとしてDSGE解釈する。
関連論文リスト
- Phase Transition for Budgeted Multi-Agent Synergy [41.486076708302456]
マルチエージェントシステムは信頼性を向上させることができるが、固定された推論予算の下では、しばしば役立つか、飽和するか、崩壊するかさえある。
我々は、現代のエージェントスタックの3つの束縛制約からこれらの状態を予測する最小限の校正可能な理論を開発する。
論文 参考訳(メタデータ) (2026-01-24T05:32:50Z) - Rational Adversaries and the Maintenance of Fragility: A Game-Theoretic Theory of Rational Stagnation [0.0]
本稿では、合理的な敵によって維持される均衡として、そのような「合理的な停滞」を説明する。
ソーシャルメディアのアルゴリズムや政治的信頼への応用は、敵が故意に合理性を維持する方法を示している。
論文 参考訳(メタデータ) (2025-10-25T09:28:15Z) - From Debate to Equilibrium: Belief-Driven Multi-Agent LLM Reasoning via Bayesian Nash Equilibrium [52.28048367430481]
マルチエージェントフレームワークは、大規模言語モデル(LLM)の推論能力を高めることができるが、通常は計算コストと収束保証が欠如している。
我々は、不完全情報ゲームとしてマルチLLMコーディネーションをリキャストし、ベイズナッシュ均衡(BNE)を求める。
我々は、分散推論と集中的な最終出力を結合する階層的強化学習パラダイムである、Nash Equilibrium (ECON)による効率的なコーディネーションを導入する。
論文 参考訳(メタデータ) (2025-06-09T23:49:14Z) - Vairiational Stochastic Games [1.6703448188585752]
本稿では分散型マルチエージェントシステムに適した新しい変分推論フレームワークを提案する。
我々のフレームワークは、非定常性と非整合エージェントの目的によって引き起こされる課題に対処する。
提案した分散アルゴリズムに対する理論的収束保証を示す。
論文 参考訳(メタデータ) (2025-03-08T03:21:23Z) - Adaptive, Doubly Optimal No-Regret Learning in Strongly Monotone and Exp-Concave Games with Gradient Feedback [75.29048190099523]
オンライン勾配降下(OGD)は、強い凸性や単調性仮定の下では二重最適であることが知られている。
本稿では,これらのパラメータの事前知識を必要としない完全適応型OGDアルゴリズム,textsfAdaOGDを設計する。
論文 参考訳(メタデータ) (2023-10-21T18:38:13Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。