論文の概要: Agentic AI Systems Should Be Designed as Marginal Token Allocators
- arxiv url: http://arxiv.org/abs/2605.01214v1
- Date: Sat, 02 May 2026 03:06:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.644437
- Title: Agentic AI Systems Should Be Designed as Marginal Token Allocators
- Title(参考訳): エージェントAIシステムは、Marginal Tokenアロケータとして設計されるべきである
- Authors: Siqi Zhu,
- Abstract要約: エージェントAIシステムは,電子トークン割り当て経済として設計・評価されるべきである,と我々は主張する。
これら4つの層がいずれも,Emphsame 1次条件を解決していることを示す。
- 参考スコア(独自算出の注目度): 2.629665653283008
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This position paper argues that agentic AI systems should be designed and evaluated as \emph{marginal token allocation economies} rather than as text generators priced by the unit. We follow a single request -- a developer asking a coding agent to fix a failing test -- through four economic layers that today are designed in isolation: a router that decides which model answers, an agent that decides whether to plan, act, verify, or defer, a serving stack that decides how to produce each token, and a training pipeline that decides whether the trace is worth learning from. We show that all four layers are solving the \emph{same} first-order condition -- marginal benefit equals marginal cost plus latency cost plus risk cost -- with different index sets and different prices. The framing is deliberately minimal: we do not propose a complete theory of AI economics. But adopting marginal token allocation as the shared accounting object explains why systems that locally minimize tokens globally misallocate them, predicts a small set of recurring failure modes (over-routing, over-delegation, under-verification, serving congestion, stale rollouts, cache misuse), and points to a concrete research agenda in token-aware evaluation, autonomy pricing, congestion-priced serving, and risk-adjusted RL budgeting.
- Abstract(参考訳): 本稿では,エージェント型AIシステムの設計と評価を,単位によって価格が上がるテキストジェネレータとしてではなく,‘emph{marginal token allocation Economy’として行うことを提案する。
私たちは、1つの要求 -- コーディングエージェントにテストの修正を依頼する開発者 – 今日の4つの経済レイヤを分離して設計する — モデル回答を決定するルータ、計画、動作、検証、延期を決定するエージェント、トークンの生成方法を決定するサービススタック、トレースが学ぶ価値があるかどうかを決定するトレーニングパイプライン – に従っています。
4つのレイヤがすべて,‘emph{same} 1次条件 -- 限界利益は限界コストとレイテンシコストとリスクコスト – を,それぞれ異なるインデックスセットと異なる価格で解決していることを示す。
私たちはAI経済学の完全な理論を提案していません。
しかし、トークンの割り当てを共有会計オブジェクトとして採用することで、トークンを世界規模で最小化するシステムが原因を説明し、繰り返し発生する障害モード(オーバールーチン、オーバーデリゲーション、アンダービライゼーション、サービス渋滞、スタルロールアウト、キャッシュ誤用)を予測し、トークン認識評価、自律価格、渋滞プライドサービス、リスク調整されたRL予算といった具体的な研究課題を指摘する。
関連論文リスト
- Avoiding Overthinking and Underthinking: Curriculum-Aware Budget Scheduling for LLMs [1.7499351967216341]
BCAE(Budget-Adaptive Curriculum Reasoning)は、推論品質とトークン効率を共同で最適化する統合フレームワークである。
BCAEには、Emphbudget-conditioned unified policy、Emphcurriculum-aware budget scheduler、Emphtruncation-aware dense reward mechanismが含まれる。
論文 参考訳(メタデータ) (2026-03-29T18:31:09Z) - Real-Time AI Service Economy: A Framework for Agentic Computing Across the Continuum [10.35088918434398]
本稿では、DAGとしてモデル化されたサービス依存グラフの構造が、分散化された価格ベースのリソース割り当てが大規模に確実に機能するかどうかの主要な決定要因であることを示す。
本稿では、クロスドメインなサブグラフをリソーススライスに分割し、よりシンプルでよく構造化されたインターフェースを市場に提供するハイブリッド管理アーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-03-05T19:14:54Z) - Conformal Thinking: Risk Control for Reasoning on a Compute Budget [60.65072883773352]
大規模言語モデル(LLM)の推論により、トークンの予算が増加するにつれて、データセットレベルの精度が向上する。
我々は、予算設定問題をリスクコントロールとして再設定し、計算を最小化しながらエラー率を制限する。
我々のフレームワークは、モデルが自信のあるときに推論を停止する上位しきい値と、未解決のインスタンスを事前に停止させる新しい下位しきい値を導入する。
論文 参考訳(メタデータ) (2026-02-03T18:17:22Z) - Market-Driven Subset Selection for Budgeted Training [1.7969777786551429]
それぞれのトレーニング例を取引可能な契約として扱う,市場ベースのフレームワークを提案する。
厳格な60kの予算の下でのGSM8Kの数学的推論では、セレクタは強い単一信号基底線でパリティを達成する。
本フレームワークは,逐次的推論および分類タスクのための固定的な計算予算の下で,多信号データキュレーションを統一する。
論文 参考訳(メタデータ) (2025-10-02T18:12:03Z) - Probably Anytime-Safe Stochastic Combinatorial Semi-Bandits [81.60136088841948]
本稿では,時間軸における後悔を最小限に抑えるアルゴリズムを提案する。
提案アルゴリズムは,レコメンデーションシステムや交通機関などの分野に適用可能である。
論文 参考訳(メタデータ) (2023-01-31T03:49:00Z) - Quantization for decentralized learning under subspace constraints [61.59416703323886]
エージェントがサブスペース制約を最小化するために個々のコスト関数を持つ分散最適化問題を考察する。
本稿では,エージェントが確率化量子化器を用いて推定値を圧縮する適応分散型戦略を提案し,検討する。
この分析は、量子化ノイズのいくつかの一般的な条件下では、平均二乗誤差と平均ビットレートの両方で戦略が安定であることを示している。
論文 参考訳(メタデータ) (2022-09-16T09:38:38Z) - Inducing Equilibria via Incentives: Simultaneous Design-and-Play Finds
Global Optima [114.31577038081026]
本稿では,デザイナーとエージェントの問題を同時に1ループで解くための効率的な手法を提案する。
設計者は平衡問題を何度も解決しないが、エージェントに対するインセンティブの全体的な影響を予測できる。
このアルゴリズムは,幅広い種類のゲームに対して,サブ線形速度で大域的最適値に収束することを示す。
論文 参考訳(メタデータ) (2021-10-04T06:53:59Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。