論文の概要: MAGE: Multi-Agent Self-Evolution with Co-Evolutionary Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2605.10064v1
- Date: Mon, 11 May 2026 06:39:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.57958
- Title: MAGE: Multi-Agent Self-Evolution with Co-Evolutionary Knowledge Graphs
- Title(参考訳): MAGE: 共進化的な知識グラフによるマルチエージェントの自己進化
- Authors: Ruiyi Yang, Zechen Li, Hao Xue, Imran Razzak, Flora D. Salim,
- Abstract要約: 本稿では,自己知識を4つの部分からなる共進化的知識グラフに外部化するフレームワークであるMAGEを紹介する。
MAGEは、プロンプトベースのフリーズバックボーンベースラインに対して強力なパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 24.729167190222782
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Self-evolving language-model agents must decide what to learn next and how to preserve what they have learned across iterations. Existing systems typically carry this cross-iteration knowledge as natural-language feedback, flat episodic memory, or implicit reinforcement signals, none of which cleanly supports a frozen weak backbone at inference time. This paper introduces MAGE (Multi-Agent Graph-guided Evolution), a framework that externalizes self-knowledge into a four-subgraph co-evolutionary knowledge graph. Its experience subgraph stores both teacher-written failure corrections and the learner's own past correct reasoning traces, which are retrieved as task-conditioned guidance for a frozen execution model. During evolution, the graph, a task-level search bandit, and a skill-level routing bandit are updated from the same reward stream, while the learner's backbone remains unchanged. We further provide structural analysis showing how append-only memory growth, bounded curriculum coverage, and task-filtered retrieval together support stable improvement of the retrieval substrate for frozen-learner evolution. Across nine benchmarks spanning mathematical reasoning, multi-hop and open-domain question answering, spatio-temporal analysis, financial numerical reasoning, medical multiple-choice, an open-world survival game, and web navigation, MAGE achieves strong performance against prompt-based frozen-backbone baselines. Ablations show that self-harvested success traces and teacher-written corrections are complementary, with success memories contributing most on reasoning-template-heavy tasks and corrective memories supporting harder composition and interaction settings.
- Abstract(参考訳): 自己進化型言語モデルエージェントは、次に何を学習するか、そして、反復を通して学んだことをどのように保存するかを決定する必要がある。
既存のシステムは、自然言語のフィードバック、平らなエピソードメモリ、暗黙の強化信号として、このクロスイテレーションの知識を典型的に持っているが、いずれも推論時に凍った弱いバックボーンをきれいにサポートしていない。
本稿では,MAGE(Multi-Agent Graph-Guided Evolution)について紹介する。
その経験グラフは、教師が書き込んだ失敗訂正と学習者の過去の正しい推論トレースの両方を格納し、フリーズ実行モデルのタスク条件付きガイダンスとして検索する。
進化中、グラフ、タスクレベルの検索帯域幅、スキルレベルのルーティング帯域幅が同じ報酬ストリームから更新され、学習者のバックボーンは変化しない。
さらに、追加のみのメモリ成長、限定カリキュラムカバレッジ、タスクフィルタリング検索が、フリーズラーナー進化のための検索基板の安定的な改善をサポートするかを示す構造解析を行った。
数学的推論、マルチホップおよびオープンドメインの質問応答、時空間分析、財務数値推論、医療的多重選択、オープンワールドサバイバルゲーム、Webナビゲーションを含む9つのベンチマークにおいて、MAGEは急速凍結バックボーンベースラインに対して強力なパフォーマンスを達成する。
アブレーションは、自己修復された成功の痕跡と教師が書き直した修正が相補的であり、成功記憶は推論の重大なタスクや、より難しい構成と相互作用設定をサポートする修正記憶に最も寄与していることを示している。
関連論文リスト
- Learn to Rank: Visual Attribution by Learning Importance Ranking [58.69028273772474]
コンピュータビジョンモデルのための視覚属性マップを生成する新しい手法を提案する。
提案手法は, 任意の数段階の勾配補正を施した1つの前方通過において, 密度の高い画素レベルの属性を生成する。
我々の実験は、一貫した定量的改善と、よりシャープで境界に沿った説明を示す。
論文 参考訳(メタデータ) (2026-04-07T12:53:22Z) - Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。
4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-23T05:41:05Z) - Automatic Question Generation for Intuitive Learning Utilizing Causal Graph Guided Chain of Thought Reasoning [8.587087233323038]
因果グラフ誘導連鎖推論とマルチエージェント言語モデルを組み合わせた新しいフレームワークを提案する。
このアプローチは、正確で意味があり、カリキュラムに準拠した質問の生成を保証する。
実験の結果,基準法に比べて70%品質が向上した。
論文 参考訳(メタデータ) (2026-01-02T08:49:58Z) - Towards Continuous Intelligence Growth: Self-Training, Continual Learning, and Dual-Scale Memory in SuperIntelliAgent [10.571643330948858]
SuperIntelliAgentは、学習可能な小さな拡散モデル(学習者)と凍結した大言語モデル(検証者)を結合するエージェント学習フレームワークである。
従来の教師付き微調整とは異なり、SuperIntelliAgentはアノテーションなしで自律的に学習する。
トレーニング可能な学習者と推論可能な検証器をペアリングすることは、知性を成長させる最小限の信頼性単位となると仮定する。
論文 参考訳(メタデータ) (2025-11-28T18:32:49Z) - Learning Task-Agnostic Representations through Multi-Teacher Distillation [59.488314181423284]
本稿では,「多数決」目的関数に基づくタスク非依存フレームワークを提案する。
この機能は,学生と教師の埋め込みの相互情報に縛られていることを実証する。
提案手法は,教師の多様性を効果的に活用し,多様な下流タスクのパフォーマンス向上を実現する。
論文 参考訳(メタデータ) (2025-10-21T14:36:33Z) - Learning to Retrieve and Reason on Knowledge Graph through Active Self-Reflection [5.164923314261229]
本稿では,知識グラフ推論ARGのための能動的自己回帰フレームワークを提案する。
フレームワーク内では、特別なトークンを利用して、知識検索が必要かどうかをテキスト的に決定する。
モデルによって生成された推論経路は高い解釈可能性を示し、モデルの構造的知識に対する理解をより深く探求することができる。
論文 参考訳(メタデータ) (2025-02-20T06:38:48Z) - Graph Memory Learning: Imitating Lifelong Remembering and Forgetting of Brain Networks [31.972924785859348]
本稿では,BGML(Brain-inspired Graph Memory Learning)というグラフメモリ学習の新たな概念を紹介する。
BGMLは、記憶と忘れの潜在的な衝突を軽減するために、特徴グラフの粒度学習に根ざした多階層的階層的漸進学習機構を組み込んでいる。
さらに,新たに追加されるインクリメンタル情報における信頼できない構造の問題に対処するために,情報自己評価のオーナシップ機構を提案する。
論文 参考訳(メタデータ) (2024-07-27T05:50:54Z) - State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。