Fugu-MT 論文翻訳(概要): A General Equilibrium Theory of Orchestrated AI Agent Systems

論文の概要: A General Equilibrium Theory of Orchestrated AI Agent Systems

arxiv url: http://arxiv.org/abs/2602.21255v1
Date: Mon, 23 Feb 2026 13:21:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.557191
Title: A General Equilibrium Theory of Orchestrated AI Agent Systems
Title（参考訳）: オーケストレーションAIエージェントシステムの一般均衡理論
Authors: Jean-Philippe Garnier,
Abstract要約: 我々は,大規模言語モデル (LLM) エージェントを集中的オーケストレーションの下で動作させるシステムに対して,一般均衡理論を確立する。機能的ワラスの法則は定理として成り立つ: 機能的過剰需要の値は、建設による消費者の予算制約の結果として、すべての価格に対してゼロである。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We establish a general equilibrium theory for systems of large language model (LLM) agents operating under centralized orchestration. The framework is a production economy in the sense of Arrow-Debreu (1954), extended to infinite-dimensional commodity spaces following Bewley (1972). Each LLM agent is modeled as a firm whose production set Y a $\subset$ H = L 2 ([0, T ], R R ) represents the feasible metric trajectories determined by its frozen model weights. The orchestrator is the consumer, choosing a routing policy over the agent DAG to maximize system welfare subject to a budget constraint evaluated at functional prices p $\in$ H A . These prices-elements of the Hilbert dual of the commodity space-assign a shadow value to each metric of each agent at each instant. We prove, via Brouwer's theorem applied to a finitedimensional approximation V K $\subset$ H, that every such economy admits at least one general equilibrium (p * , y * , $π$ * ). A functional Walras' law holds as a theorem: the value of functional excess demand is zero for all prices, as a consequence of the consumer's budget constraint-not by construction. We further establish Pareto optimality (First Welfare Theorem), decentralizability of Pareto optima (Second Welfare Theorem), and uniqueness with geometric convergence under a contraction condition (Banach). The orchestration dynamics constitute a Walrasian t{â}tonnement that converges globally under the contraction condition, unlike classical t{â}tonnement (Scarf, 1960). The framework admits a DSGE interpretation with SLO parameters as policy rates.
Abstract（参考訳）: 我々は,大規模言語モデル (LLM) エージェントを集中的オーケストレーションの下で動作させるシステムに対して,一般均衡理論を確立する。このフレームワークはArrow-Debreu (1954) という意味で生産経済であり、Bewley (1972) に続く無限次元のコモディティ空間に拡張されている。各LSMエージェントは、生産集合 Y a $\subset$ H = L 2 ([0, T ], R R ) が凍結モデル重みによって決定される可能な計量軌跡を表す会社としてモデル化される。オーケストレータは消費者であり、機能価格p$$$$\in$HAで評価された予算制約の対象となるシステム福祉を最大化するために、エージェントDAGよりもルーティングポリシーを選択する。商品空間のヒルベルト双対のこれらの価格要素は、各瞬間に各エージェントの計量に影値を割り当てる。ブロウワーの定理を有限次元近似 V K $\subset$ H に適用することにより、そのような経済は少なくとも1つの一般均衡(p * , y * , $π$ * )を許容することを示した。機能的ワラスの法則は定理として成り立つ: 機能的過剰需要の値は、建設による消費者の予算制約の結果として、すべての価格に対してゼロである。さらに,パレート最適性(第1次福祉理論),パレート最適性(第2次福祉理論)の分散性,および縮退条件(バナッハ)の下での幾何収束による特異性を確立する。オーケストレーション力学は、古典的な t{â}tonnement (Scarf, 1960) とは異なり、世界中の収縮条件下で収束するワラシア t{â}tonnement を構成する。このフレームワークは、SLOパラメータをポリシーレートとしてDSGE解釈する。

関連論文リスト

Regularized Online RLHF with Generalized Bilinear Preferences [68.44113000390544]
一般的な嗜好を伴う文脈的オンラインRLHFの問題を考える。一般化された双線形選好モデルを用いて、低ランクなスキュー対称行列による選好を捉える。グリーディポリシーの双対ギャップは推定誤差の正方形によって有界であることを示す。
論文参考訳（メタデータ） (2026-02-26T15:27:53Z)
Stability and Generalization of Push-Sum Based Decentralized Optimization over Directed Graphs [55.77845440440496]
プッシュベースの分散通信は、情報交換が非対称である可能性のある通信ネットワークの最適化を可能にする。我々は、グラディエント・プッシュ(SGP)アルゴリズムのための統一的な一様安定性フレームワークを開発する。重要な技術的要素は、2つの量に束縛された不均衡認識の一般化である。
論文参考訳（メタデータ） (2026-02-24T05:32:03Z)
Phase Transition for Budgeted Multi-Agent Synergy [41.486076708302456]
マルチエージェントシステムは信頼性を向上させることができるが、固定された推論予算の下では、しばしば役立つか、飽和するか、崩壊するかさえある。我々は、現代のエージェントスタックの3つの束縛制約からこれらの状態を予測する最小限の校正可能な理論を開発する。
論文参考訳（メタデータ） (2026-01-24T05:32:50Z)
Rational Adversaries and the Maintenance of Fragility: A Game-Theoretic Theory of Rational Stagnation [0.0]
本稿では、合理的な敵によって維持される均衡として、そのような「合理的な停滞」を説明する。ソーシャルメディアのアルゴリズムや政治的信頼への応用は、敵が故意に合理性を維持する方法を示している。
論文参考訳（メタデータ） (2025-10-25T09:28:15Z)
From Debate to Equilibrium: Belief-Driven Multi-Agent LLM Reasoning via Bayesian Nash Equilibrium [52.28048367430481]
マルチエージェントフレームワークは、大規模言語モデル(LLM)の推論能力を高めることができるが、通常は計算コストと収束保証が欠如している。我々は、不完全情報ゲームとしてマルチLLMコーディネーションをリキャストし、ベイズナッシュ均衡(BNE)を求める。我々は、分散推論と集中的な最終出力を結合する階層的強化学習パラダイムである、Nash Equilibrium (ECON)による効率的なコーディネーションを導入する。
論文参考訳（メタデータ） (2025-06-09T23:49:14Z)
Vairiational Stochastic Games [1.6703448188585752]
本稿では分散型マルチエージェントシステムに適した新しい変分推論フレームワークを提案する。我々のフレームワークは、非定常性と非整合エージェントの目的によって引き起こされる課題に対処する。提案した分散アルゴリズムに対する理論的収束保証を示す。
論文参考訳（メタデータ） (2025-03-08T03:21:23Z)
Adaptive, Doubly Optimal No-Regret Learning in Strongly Monotone and Exp-Concave Games with Gradient Feedback [75.29048190099523]
オンライン勾配降下(OGD)は、強い凸性や単調性仮定の下では二重最適であることが知られている。本稿では,これらのパラメータの事前知識を必要としない完全適応型OGDアルゴリズム,textsfAdaOGDを設計する。
論文参考訳（メタデータ） (2023-10-21T18:38:13Z)
Near-Optimal No-Regret Learning for Correlated Equilibria in Multi-Player General-Sum Games [104.74734408204749]
マルチプレイヤーの汎用正規形式ゲームにおいて,OMWU(Optimistic Multiplicative Weights Update)を用いているエージェントが全員,O(textrmpolylog(T))$(T$)$(T$)$(OMWU)$(OMWU)$(OMWU)$(OMWU)$(OMWU)$)であることを示す。外部の後悔から内部の後悔へと結果を拡張し、後悔を交換することで、近似した平衡に収束する非結合学習ダイナミクスを確立する。
論文参考訳（メタデータ） (2021-11-11T01:19:53Z)
VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文参考訳（メタデータ） (2020-04-19T18:00:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。