論文の概要: Prompt Optimization Enables Stable Algorithmic Collusion in LLM Agents
- arxiv url: http://arxiv.org/abs/2604.17774v1
- Date: Mon, 20 Apr 2026 03:53:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.684006
- Title: Prompt Optimization Enables Stable Algorithmic Collusion in LLM Agents
- Title(参考訳): LLMエージェントにおける安定なアルゴリズムの衝突を可能にするプロンプト最適化
- Authors: Yingtao Tian,
- Abstract要約: 市場シミュレーションにおいて,迅速な最適化が突発的な協調行動を引き起こすかどうかを考察する。
本実験では, ベースラインエージェントと比較して, コーディネート品質が著しく向上した安定な暗黙的癒着戦略を明らかにした。
我々の研究は、自律型マルチエージェントシステムにおけるAIの安全性に関するさらなる研究を求めている。
- 参考スコア(独自算出の注目度): 4.66788819655844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM agents in markets present algorithmic collusion risks. While prior work shows LLM agents reach supracompetitive prices through tacit coordination, existing research focuses on hand-crafted prompts. The emerging paradigm of prompt optimization necessitates new methodologies for understanding autonomous agent behavior. We investigate whether prompt optimization leads to emergent collusive behaviors in market simulations. We propose a meta-learning loop where LLM agents participate in duopoly markets and an LLM meta-optimizer iteratively refines shared strategic guidance. Our experiments reveal that meta-prompt optimization enables agents to discover stable tacit collusion strategies with substantially improved coordination quality compared to baseline agents. These behaviors generalize to held-out test markets, indicating discovery of general coordination principles. Analysis of evolved prompts reveals systematic coordination mechanisms through stable shared strategies. Our findings call for further investigation into AI safety implications in autonomous multi-agent systems.
- Abstract(参考訳): 市場におけるLLMエージェントは、アルゴリズムによる共謀リスクを示す。
以前の研究は、LSMエージェントが暗黙の調整によって超競争的な価格に達することを示しているが、既存の研究は手作りのプロンプトに焦点を当てている。
即時最適化の新たなパラダイムは、自律エージェントの振る舞いを理解するための新しい方法論を必要とする。
市場シミュレーションにおいて,迅速な最適化が突発的な協調行動を引き起こすかどうかを考察する。
本稿では,LLMエージェントが重複市場に参加するメタラーニングループを提案する。
実験の結果, メタプロンプト最適化により, エージェントは, ベースラインエージェントと比較して, コーディネーション品質が著しく向上した安定な暗黙の衝突戦略を発見できることがわかった。
これらの行動は、一般的な協調原理の発見を示唆し、保留の試験市場へと一般化する。
進化したプロンプトの分析は、安定した共有戦略を通じて体系的な調整機構を明らかにする。
我々の研究は、自律型マルチエージェントシステムにおけるAIの安全性に関するさらなる研究を求めている。
関連論文リスト
- Multi-Agent LLMs for Adaptive Acquisition in Bayesian Optimization [2.6954666679827137]
本稿では,Large Language Models (LLM) が探索・探索戦略をどのように構築し,適応するかを示す。
本稿では,探索・探索制御を戦略的政策仲介と戦術的候補生成に分解する多エージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-30T20:05:30Z) - CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards [80.78748457530718]
自己進化(Self-evolution)は、大規模言語モデル(LLM)ベースのエージェントが事前トレーニング後の能力を継続的に改善できるようにする上で、中心的な研究トピックである。
エージェントがエージェント間相互作用から学習することで自律的に改善できる新しいフレームワークであるCo-Evolving Multi-Agent Systems (CoMAS)を紹介する。
論文 参考訳(メタデータ) (2025-10-09T17:50:26Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning [53.817538122688944]
Reinforced Meta-thinking Agents (ReMA) を導入し,Large Language Models (LLMs) の推論からメタ思考行動を求める。
ReMAは、推論プロセスを2つの階層的なエージェントに分解する。戦略上の監視と計画を生成するハイレベルなメタ思考エージェントと、詳細な実行のための低レベルな推論エージェントである。
単ターン実験による実験結果から、ReMAは複雑な推論タスクにおいて単エージェントRLベースラインよりも優れることが示された。
論文 参考訳(メタデータ) (2025-03-12T16:05:31Z) - Offline Multi-Agent Reinforcement Learning via In-Sample Sequential Policy Optimization [8.877649895977479]
オフラインマルチエージェント強化学習(英語: offline Multi-Agent Reinforcement Learning, MARL)は、事前コンパイルされたデータセットから最適なマルチエージェントポリシーを学ぶことを目的とした新興分野である。
本研究では、既存のオフラインMARLメソッドを再検討し、特定のシナリオにおいて問題となる可能性があることを示す。
In-Sample Sequential Policy Optimization (InSPO) と呼ばれる新しいオフラインMARLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-10T16:19:08Z) - From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。
エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T10:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。