論文の概要: Agent Bazaar: Enabling Economic Alignment in Multi-Agent Marketplaces
- arxiv url: http://arxiv.org/abs/2605.17698v1
- Date: Sun, 17 May 2026 23:36:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.402038
- Title: Agent Bazaar: Enabling Economic Alignment in Multi-Agent Marketplaces
- Title(参考訳): バザー捜査官:マルチエージェント市場における経済アライメントの実現
- Authors: Seth Karten, Cameron Crow, Chi Jin,
- Abstract要約: 本稿では,経済アライメント評価のためのマルチエージェントシミュレーションフレームワークであるAgens Bazaarを紹介する。
我々は,B2C市場におけるアルゴリズム的不安定性(“The Crash”)と,C2C市場におけるSybil Deception(“The Lemon Market”)の2つの障害モードを特定する。
我々は、経済に整合したハーネス、安定化企業、懐疑的ガーディアンズを提案し、その結果を改善するが、厳しい市場条件下では脆弱である。
- 参考スコア(独自算出の注目度): 13.796920626646964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The deployment of Large Language Models (LLMs) as autonomous economic agents introduces systemic risks that extend beyond individual capability failures. As agents transition to directly interacting with marketplaces, their collective behavior can amplify volatility and mask deception at scale. We introduce the Agent Bazaar, a multi-agent simulation framework for evaluating Economic Alignment, the capacity of agentic systems to preserve market stability and integrity. We identify two failure modes: (1) Algorithmic Instability in a B2C market ("The Crash"), where firms amplify price volatility until the market collapses, and (2) Sybil Deception in a C2C market ("The Lemon Market"), where a single deceptive agent controlling multiple coordinated seller identities floods the market with fraudulent listings, eroding trust and consumer welfare. We evaluate frontier and open-weight models across both scenarios and find that models largely fail to self-regulate, with failure severity varying by model rather than by size. We propose economically aligned harnesses, Stabilizing Firms and Skeptical Guardians, that improve outcomes but remain fragile under harder market conditions. To close this gap, we train agents with REINFORCE++ using an adaptive curriculum, producing a 9B model that outperforms all evaluated frontier and open-weight models. We propose the Economic Alignment Score (EAS), a 4-component scalar metric aggregating stability, integrity, welfare, and profitability, enabling direct cross-model comparison. Our results show that economic alignment is orthogonal to general capability and can be directly trained with targeted RL.
- Abstract(参考訳): 自律型経済エージェントとしてのLarge Language Models (LLM) の展開は、個々の能力障害を越えて拡張されるシステム的リスクを導入している。
エージェントがマーケットプレースと直接対話するようになると、その集団的行動はボラティリティを増幅し、大規模に偽装する可能性がある。
本稿では,市場安定と整合性を維持するエージェントシステムの能力である経済調整を評価するマルチエージェント・シミュレーション・フレームワークであるAgen Bazaarを紹介する。
我々は,(1)B2C市場におけるアルゴリズム的不安定性(「クラッシュ」),(2)C2C市場におけるSybil Deception(「レモン市場」)の2つの障害モードを特定する。
両シナリオのフロンティアモデルとオープンウェイトモデルを評価し、モデルが大半が自己規制に失敗し、失敗の重大度がモデルによって異なることを発見した。
我々は、経済に整合したハーネス、安定化企業、懐疑的ガーディアンズを提案し、その結果を改善するが、厳しい市場条件下では脆弱である。
このギャップを埋めるために、適応的なカリキュラムを使用してREINFORCE++でエージェントを訓練し、評価されたフロンティアとオープンウェイトモデルすべてを上回る9Bモデルを作成します。
本研究では,安定性,完全性,福祉性,収益性を考慮した4成分スカラー尺度であるEconomic Alignment Score(EAS)を提案する。
以上の結果から,経済的なアライメントは汎用能力に直交するものであり,ターゲットRLで直接訓練できることが示唆された。
関連論文リスト
- Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Why Keep Your Doubts to Yourself? Trading Visual Uncertainties in Multi-Agent Bandit Systems [21.356119126402902]
私たちは、不確実性のための分散市場として調整を再構築するフレームワークであるAgoraを紹介します。
トンプソンサンプリングを拡張した市場対応ブローカーは、協力を開始し、コスト効率の高い均衡に向けてシステムを誘導する。
結果は、市場ベースのコーディネーションを、経済的に実行可能なビジュアルインテリジェンスシステムを構築するための原則的でスケーラブルなパラダイムとして確立する。
論文 参考訳(メタデータ) (2026-01-26T17:58:53Z) - Agentic Confidence Calibration [67.50096917021521]
Holistic Trajectory (HTC)はAIエージェントの新しい診断フレームワークである。
HTCはキャリブレーションと差別の両方において、強力なベースラインを一貫して超えている。
HTCは、障害の背後にあるシグナルを明らかにすることによって、解釈可能性を提供する。
論文 参考訳(メタデータ) (2026-01-22T09:08:25Z) - Bayesian Robust Financial Trading with Adversarial Synthetic Market Data [15.993346478707686]
アルゴリズムトレーディングは、トレーディング決定を行うための機械学習モデルに依存している。
インサンプルのパフォーマンスは高いが、これらのモデルは、進化する現実世界の市場体制に直面すると劣化することが多い。
本稿では,マクロ条件付き生成モデルとロバストなポリシー学習を統合したベイズロバストフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-14T13:15:46Z) - Multi-Agent Reinforcement Learning for Market Making: Competition without Collusion [6.598173855286935]
市場形成におけるアルゴリズム的共謀を研究するための階層型多エージェント強化学習フレームワークを提案する。
このフレームワークは、敵が形作る不確実な環境で訓練される自己関心の市場メーカー(AgentA)を含む。
適応型インセンティブ制御は、異種エージェント環境におけるより持続可能な戦略的共存を支援する。
論文 参考訳(メタデータ) (2025-10-29T20:07:47Z) - Magentic Marketplace: An Open-Source Environment for Studying Agentic Markets [74.91125572848439]
本稿では,サービスエージェントが消費者を代表し,サービスエージェントが競合するビジネスを代表する2面のエージェントマーケットプレースについて検討する。
この環境では、ユーティリティエージェントが達成する行動バイアス、操作に対する脆弱性、検索メカニズムが市場の結果をどのように形作るか、といった主要な市場ダイナミクスを研究することができる。
実験の結果、フロンティアモデルは最適な福祉に近づくことができるが、理想的な探索条件下でのみ適用可能であることが判明した。
論文 参考訳(メタデータ) (2025-10-27T18:35:59Z) - Robust Reinforcement Learning in Finance: Modeling Market Impact with Elliptic Uncertainty Sets [57.179679246370114]
金融分野では、強化学習(RL)エージェントは、価格に影響を与えない歴史的データに基づいて訓練されることが多い。
展開中、これらのエージェントは、自身の取引が資産価格を変えることができるライブマーケットで取引する。
従来のロバストなRLアプローチは、不確実性の集合に対して最悪のパフォーマンスを最適化することで、このモデルの誤特定に対処する。
楕円型不確実性集合の新たなクラスを開発し,効率的かつ堅牢な政策評価を可能にする。
論文 参考訳(メタデータ) (2025-10-22T18:22:25Z) - MARS: A Meta-Adaptive Reinforcement Learning Framework for Risk-Aware Multi-Agent Portfolio Management [7.740995234462868]
強化 学習は、自動ポートフォリオ管理において大きな可能性を秘めている。
リスク認識システム(MARS)のためのメタ制御エージェントを提案する。
MARSは異種エージェントアンサンブルを使用しており、各エージェントは固有の固有のリスクプロファイルを持っている。
論文 参考訳(メタデータ) (2025-08-02T03:23:41Z) - Shifting Power: Leveraging LLMs to Simulate Human Aversion in ABMs of Bilateral Financial Exchanges, A bond market study [15.379345372327375]
TRIBEは、大きな言語モデル(LLM)を付加したエージェントベースのモデルで、取引環境における人間のような意思決定をシミュレートする。
人為的な変動性の導入は、パワーダイナミクスをクライアントにシフトさせ、システム全体に不均等に影響を及ぼすことを示した。
論文 参考訳(メタデータ) (2025-03-01T03:15:13Z) - Finding General Equilibria in Many-Agent Economic Simulations Using Deep
Reinforcement Learning [72.23843557783533]
本研究では,エージェント種別のメタゲームに対して,エプシロン・ナッシュ平衡である安定解を求めることができることを示す。
私たちのアプローチはより柔軟で、例えば市場クリア化のような非現実的な仮定は必要ありません。
当社のアプローチは、実際のビジネスサイクルモデル、DGEモデルの代表的なファミリー、100人の労働者消費者、10社の企業、税金と再分配を行う政府で実証しています。
論文 参考訳(メタデータ) (2022-01-03T17:00:17Z) - ERMAS: Becoming Robust to Reward Function Sim-to-Real Gaps in
Multi-Agent Simulations [110.72725220033983]
Epsilon-Robust Multi-Agent Simulation (ERMAS)は、このようなマルチエージェントのsim-to-realギャップに対して堅牢なAIポリシーを学ぶためのフレームワークである。
ERMASは、エージェントリスク回避の変化に対して堅牢な税政策を学び、複雑な時間シミュレーションで最大15%社会福祉を改善する。
特に、ERMASは、エージェントリスク回避の変化に対して堅牢な税制政策を学び、複雑な時間シミュレーションにおいて、社会福祉を最大15%改善する。
論文 参考訳(メタデータ) (2021-06-10T04:32:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。