Fugu-MT 論文翻訳(概要): CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery

論文の概要: CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery

arxiv url: http://arxiv.org/abs/2604.01658v1
Date: Thu, 02 Apr 2026 05:59:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-03 14:21:10.468676
Title: CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery
Title（参考訳）: CORAL: オープンエンドディスカバリのための自律的マルチエージェント進化を目指す
Authors: Ao Qu, Han Zheng, Zijian Zhou, Yihao Yan, Yihong Tang, Shao Yong Ong, Fenglu Hong, Kaichen Zhou, Chonghe Jiang, Minwei Kong, Jiacheng Zhu, Xuan Jiang, Sirui Li, Cathy Wu, Bryan Kian Hsiang Low, Jinhua Zhao, Paul Pu Liang,
Abstract要約: 大規模言語モデル(LLM)ベースの進化は、オープンな発見のための有望なアプローチである。オープンエンド問題における自律的マルチエージェント進化のための最初のフレームワークであるCORALを紹介する。コーラルは、厳格な制御を長期にわたるエージェントに置き換え、探索し、反射し、協力する。
参考スコア（独自算出の注目度）: 67.47220507982522
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language model (LLM)-based evolution is a promising approach for open-ended discovery, where progress requires sustained search and knowledge accumulation. Existing methods still rely heavily on fixed heuristics and hard-coded exploration rules, which limit the autonomy of LLM agents. We present CORAL, the first framework for autonomous multi-agent evolution on open-ended problems. CORAL replaces rigid control with long-running agents that explore, reflect, and collaborate through shared persistent memory, asynchronous multi-agent execution, and heartbeat-based interventions. It also provides practical safeguards, including isolated workspaces, evaluator separation, resource management, and agent session and health management. Evaluated on diverse mathematical, algorithmic, and systems optimization tasks, CORAL sets new state-of-the-art results on 10 tasks, achieving 3-10 times higher improvement rates with far fewer evaluations than fixed evolutionary search baselines across tasks. On Anthropic's kernel engineering task, four co-evolving agents improve the best known score from 1363 to 1103 cycles. Mechanistic analyses further show how these gains arise from knowledge reuse and multi-agent exploration and communication. Together, these results suggest that greater agent autonomy and multi-agent evolution can substantially improve open-ended discovery. Code is available at https://github.com/Human-Agent-Society/CORAL.
Abstract（参考訳）: 大規模言語モデル(LLM)に基づく進化は、持続的な探索と知識の蓄積を必要とするオープン・エンド・ディスカバリーにとって有望なアプローチである。既存の方法はまだ固定ヒューリスティックとハードコード探索規則に大きく依存しており、LLMエージェントの自律性を制限する。オープンエンド問題における自律的マルチエージェント進化のための最初のフレームワークであるCORALを紹介する。 CORALは、厳格なコントロールを、共有された永続メモリ、非同期マルチエージェント実行、心拍ベースの介入を探索、反映、コラボレーションする長時間実行エージェントに置き換える。また、独立したワークスペース、評価者分離、リソース管理、エージェントセッションとヘルス管理など、実用的な安全対策も提供する。多様な数学的、アルゴリズム、システム最適化タスクに基づいて評価され、CoRALは10タスクに新しい最先端の結果を設定し、タスク間の固定された進化的検索ベースラインよりもはるかに少ない評価で3～10倍高い改善率を達成する。 Anthropicのカーネルエンジニアリングタスクでは、4つの共進化エージェントが1363年から1103サイクルで最もよく知られたスコアを改善した。メカニスティック分析は、知識の再利用とマルチエージェント探索とコミュニケーションからこれらの利益がどのように生まれるかをさらに示している。これらの結果は、エージェントの自律性とマルチエージェントの進化が、オープンエンドの発見を大幅に改善できることを示している。コードはhttps://github.com/Human-Agent-Society/CORAL.comで公開されている。

関連論文リスト

CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards [80.78748457530718]
自己進化(Self-evolution)は、大規模言語モデル(LLM)ベースのエージェントが事前トレーニング後の能力を継続的に改善できるようにする上で、中心的な研究トピックである。エージェントがエージェント間相互作用から学習することで自律的に改善できる新しいフレームワークであるCo-Evolving Multi-Agent Systems (CoMAS)を紹介する。
論文参考訳（メタデータ） (2025-10-09T17:50:26Z)
AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning [129.44038804430542]
本稿では,マルチターン対話型意思決定のためのLLMエージェントをRLで学習する新しいフレームワークであるAgentGym-RLを紹介する。本研究では,探索-探索バランスと安定したRL最適化のためのトレーニング手法であるScalingInter-RLを提案する。当社のエージェントは、さまざまな環境にまたがる27のタスクで、商用モデルにマッチするか、超えています。
論文参考訳（メタデータ） (2025-09-10T16:46:11Z)
SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents [32.76299758137446]
大規模言語モデル(LLM)ベースのエージェントは、最近、複雑な推論とツールの使用において、環境とのマルチステップのインタラクションを通じて印象的な機能を示した。これらの軌道にはリッチなフィードバックが含まれており、エージェントを正しい方向に誘導して問題を正しく解くことができる。モンテカルロ木探索 (MCTS) のような一般的な手法は、探索と搾取を効果的にバランスさせることができるが、それらは様々な軌道間の相互依存を無視している。エージェントが推論プロセスを反復的に最適化できる自己進化フレームワークSE-Agentを提案する。
論文参考訳（メタデータ） (2025-08-04T05:51:55Z)
Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards [1.179778723980276]
MARL(Multi-agent Reinforcement Learning)は、シーケンシャルな意思決定と制御タスクの鍵となるフレームワークである。これらのシステムを現実のシナリオに展開するには、分散トレーニング、多様なエージェントセット、そして頻繁な環境報酬信号から学ぶ必要がある。我々は,新しいグラフニューラルネットワーク(GNN)に基づく本質的なモチベーションを利用して,異種エージェントポリシーの学習を容易にするCoHetアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-08-12T21:38:40Z)
EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。 EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2024-06-20T11:49:23Z)
Cooperative Exploration for Multi-Agent Deep Reinforcement Learning [127.4746863307944]
深層強化学習のための協調型マルチエージェント探索(CMAE)を提案する。ゴールは正規化エントロピーに基づく手法により、複数の射影状態空間から選択される。 CMAEが様々なタスクのベースラインを一貫して上回っていることを実証する。
論文参考訳（メタデータ） (2021-07-23T20:06:32Z)
UneVEn: Universal Value Exploration for Multi-Agent Reinforcement Learning [53.73686229912562]
我々はUniversal Value Exploration(UneVEn)と呼ばれる新しいMARLアプローチを提案する。 UneVEnは、一連の関連するタスクと、普遍的な後継機能の線形分解を同時に学習する。一連の探索ゲームにおける実証的な結果、エージェント間の重要な調整を必要とする協調捕食・捕食作業への挑戦、およびStarCraft IIのマイクロマネジメントベンチマークは、UneVEnが他の最先端のMARLメソッドが失敗するタスクを解決できることを示している。
論文参考訳（メタデータ） (2020-10-06T19:08:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。