論文の概要: SAGE: A Quantitative Evaluation of Socialized Evolution in Agent Ecosystems
- arxiv url: http://arxiv.org/abs/2606.03544v1
- Date: Tue, 02 Jun 2026 12:08:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.983767
- Title: SAGE: A Quantitative Evaluation of Socialized Evolution in Agent Ecosystems
- Title(参考訳): SAGE:エージェント生態系における社会的進化の定量的評価
- Authors: Linyue Pan, Yaoming Zhu, Lin Qiu, Xuezhi Cao, Xunliang Cai,
- Abstract要約: SAGE(Social Agent Group Evolution)は,2つの計算条件を比較した評価フレームワークである。
群の歴史は普遍的な増幅器ではなく、最強のエージェントは自己進化の天井を超えない。
競合する環境では、カウンターファクトコントロールは、エージェントが相手固有の戦略を開発するよりも一般的に改善することを明らかにする。
- 参考スコア(独自算出の注目度): 23.807355053389273
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Self-improving language agents are typically evaluated in isolation: an agent attempts a task, receives feedback, and iteratively refines its own behavior. Yet agents increasingly operate alongside peers whose strategies and outcomes are publicly visible. This raises an under-studied question: when does shared experience produce improvements that self-improvement alone cannot achieve? We introduce SAGE (Social Agent Group Evolution),an evaluation framework that compares two compute-matched conditions: SocialEvo, where agents from five distinct model families co-evolve with access to all peers' histories; and SelfEvo, where each agent receives the same number of task attempts but sees only its own past, which is conventional in self-improving agent studies. We instantiate SAGE in three arenas: open-ended ML research, long-horizon economic planning, and strategic multiplayer play, evaluated across multiple evolutionary rounds. We find that group history is not a universal amplifier: the strongest agent does not exceed its self-evolution ceiling. However, agents that plateau under self-improvement can achieve significant breakthroughs when peer experience is available. In competitive settings, counterfactual controls reveal that agents improve generally rather than developing opponent-specific strategies. Across different forms of shared history, filtered peer traces and reflective summaries often outperform raw logs, indicating that social gains depend on abstraction rather than exposure volume. These findings reveal that peer-history gains are agent-specific, arena-dependent, and contingent on the capacity to abstract transferable knowledge from public traces.
- Abstract(参考訳): エージェントはタスクを試み、フィードバックを受け取り、自身の振る舞いを反復的に洗練する。
しかし、エージェントは、戦略や成果が公然と見える仲間と共に活動するようになっている。
共有体験はいつ、自己改善だけでは達成できない改善をもたらすのか?
SAGE(Social Agent Group Evolution, 社会エージェントグループ進化)は, 5つの異なるモデルファミリーのエージェントがすべての人物の履歴にアクセスするように進化する,SocialEvo(SocialEvo, 社会エージェントグループ進化)と, エージェントが同じ数のタスク試行を受けるが, 自分自身の過去しか見ることができないセルフエボ(SelfEvo, 自己改善エージェント研究における従来の手法)の2つの条件を比較した評価フレームワークである。
SAGEを3つのアリーナ(オープンエンドML研究、長期経済計画、戦略的マルチプレイヤープレイ)でインスタンス化し、複数の進化ラウンドで評価する。
群の歴史は普遍的な増幅器ではなく、最強のエージェントは自己進化の天井を超えない。
しかし、自己改善剤は、ピア体験が利用可能であれば、大きなブレークスルーを達成できる。
競合する環境では、カウンターファクトコントロールは、エージェントが相手固有の戦略を開発するよりも一般的に改善することを明らかにする。
異なる形態の共有履歴、フィルターされたピアトレース、反射的な要約は、しばしば生のログよりも優れており、社会的な利益は露光量よりも抽象に依存することを示している。
これらの結果から,ピアヒストリーゲインはエージェント特異的で,アリーナ依存的であり,公的な痕跡から伝達可能な知識を抽象化する能力に依存していることが明らかとなった。
関連論文リスト
- Sequential Strategic Classification with Multi-Stage Selective Classifiers [11.395181681423892]
自己関心のある個人やエージェントが、適切な意思決定結果を得るために、その反応を操作できる問題について検討する。
以前の研究は、分類器の設計にのみ焦点をあてることによって、この難問から抜け出すという根本的な障害を実証してきた。
本稿では,エージェントが行動にどう適応するかを捉えることによって,戦略的分類の逐次的多段階モデルを提案する。
論文 参考訳(メタデータ) (2026-05-05T18:42:21Z) - Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents [44.28040661008415]
大規模言語モデルエージェントが数百万の人口に拡大するにつれ、重要な疑問が浮かび上がってくる。
大規模自律エージェント社会において,この問題に対する最初の経験的評価を提示する。
社会は複雑な推論タスクにおいて、個々のフロンティアモデルを上回り、分散情報を滅多に合成せず、さらに簡単な調整タスクを失敗することが多い。
論文 参考訳(メタデータ) (2026-04-24T11:11:36Z) - CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery [67.47220507982522]
大規模言語モデル(LLM)ベースの進化は、オープンな発見のための有望なアプローチである。
オープンエンド問題における自律的マルチエージェント進化のための最初のフレームワークであるCORALを紹介する。
コーラルは、厳格な制御を長期にわたるエージェントに置き換え、探索し、反射し、協力する。
論文 参考訳(メタデータ) (2026-04-02T05:59:06Z) - RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback [54.39884046754265]
RetroAgentは、エージェントが複雑なインタラクティブ環境をマスターできるオンラインRLフレームワークである。
実験の結果,RetroAgentはSOTA(State-of-the-art)の性能を達成できた。
論文 参考訳(メタデータ) (2026-03-09T16:23:33Z) - Agent Learning via Early Experience [93.83579011718858]
言語エージェントの長期的な目標は、彼ら自身の経験から学び、改善することであり、最終的には複雑な現実世界のタスクにおいて人間より優れています。
現在のエージェントのほとんどは、専門家データによる教師付き微調整に依存しており、スケールと一般化が不十分である。
本研究では,(1)環境力学における政策の基盤として収集された状態を利用するインプリシット・ワールド・モデリング,(2)エージェントが最適な行動から学習し,推論と意思決定を改善するための自己回帰という2つの手法について検討する。
論文 参考訳(メタデータ) (2025-10-09T17:59:17Z) - OAgents: An Empirical Study of Building Effective Agents [46.50371876218872]
キーエージェントコンポーネントにおける一般的な設計選択の影響を,公平かつ厳密な方法で検討する。
この結果に基づいて,新たな基盤エージェントフレームワークであるOAgentsをオープンソースとして開発しています。
論文 参考訳(メタデータ) (2025-06-17T17:59:02Z) - Learning to Incentivize Other Learning Agents [73.03133692589532]
我々は、学習インセンティブ関数を用いて、RLエージェントに他のエージェントに直接報酬を与える能力を持たせる方法を示す。
このようなエージェントは、一般的なマルコフゲームにおいて、標準のRLと対戦型エージェントを著しく上回っている。
私たちの仕事は、マルチエージェントの未来において共通の善を確実にする道のりに沿って、より多くの機会と課題を指しています。
論文 参考訳(メタデータ) (2020-06-10T20:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。