論文の概要: Skill-MAS: Evolving Meta-Skill for Automatic Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2606.18837v1
- Date: Wed, 17 Jun 2026 09:12:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.081387
- Title: Skill-MAS: Evolving Meta-Skill for Automatic Multi-Agent Systems
- Title(参考訳): Skill-MAS: 自動マルチエージェントシステムのためのメタスキルの進化
- Authors: Hehai Lin, Qi Yang, Chengwei Qin,
- Abstract要約: 大規模言語モデル(LLM)に基づく自動マルチエージェントシステム(MAS)生成は,複雑なタスクに対処するための重要なフロンティアとなっている。
推論時間MASは凍結フロンティアLLMを利用するが、過去の経験から学ぶことなく同じ検索を繰り返す。
トレーニングタイムMASは、勾配更新を通じてエクスペリエンスを内部化するが、より小さなモデルの低機能天井によって制約される。
Skill-MASは,高レベルのオーケストレーション機能を進化可能なメタスキルとして概念化し,パラメトリック更新から保持体験を分離する新しい第3のパスである。
- 参考スコア(独自算出の注目度): 16.25298848475875
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Model (LLM)-based automatic Multi-Agent Systems (MAS) generation has become a crucial frontier for tackling complex tasks. However, existing methods face a dilemma between model capability and experience retention. Inference-time MAS leverages frozen frontier LLMs but repeats identical searches without learning from past experience. Conversely, Training-time MAS internalizes experience via gradient updates but is constrained by the low capability ceiling of smaller models, and is hard to scale to large frontier LLMs. To bridge this gap, we propose Skill-MAS, a novel third path that decouples experience retention from parametric updates by conceptualizing the high-level orchestration capability as an evolvable Meta-Skill. Skill-MAS refines this architectural knowledge through a closed optimization loop: (1) Multi-Trajectory Rollout samples a behavioral distribution for each task under the current Meta-Skill; and (2) Selective Reflection adaptively selects priority tasks and applies hierarchical contrastive analysis to distill systemic experience into generalizable, strategy-level principles. Extensive experiments across four complex benchmarks and four distinct LLMs demonstrate that Skill-MAS not only achieves remarkable performance gains but also maintains a favorable cost-performance trade-off. Further analysis reveals that the evolved Meta-Skills are highly robust and exhibit strong transferability across unseen tasks and different LLMs.
- Abstract(参考訳): 大規模言語モデル(LLM)に基づく自動マルチエージェントシステム(MAS)生成は,複雑なタスクに対処するための重要なフロンティアとなっている。
しかし、既存の手法はモデル能力と経験的保持の間にジレンマに直面している。
推論時間MASは凍結フロンティアLLMを利用するが、過去の経験から学ぶことなく同じ検索を繰り返す。
逆に、トレーニングタイムMASは、勾配更新を通じて経験を内部化するが、より小さなモデルの低機能天井によって制約されるため、大きなフロンティアLSMへのスケーリングは困難である。
このギャップを埋めるため,我々は,高レベルのオーケストレーション機能を進化可能なメタスキルとして概念化し,パラメトリック更新から保持を分離する,新たな第3のパスであるSkill-MASを提案する。
Skill-MASはこのアーキテクチャの知識を,(1)Multi-Trajectory Rolloutが現在のメタスキルの下で各タスクの行動分布をサンプリングし,(2)Selective Reflectionが優先課題を適応的に選択し,階層的コントラスト分析を適用して,システム体験を一般化可能な戦略レベルの原則に抽出する,という,クローズドな最適化ループを通じて洗練する。
4つの複雑なベンチマークと4つの異なるLCMによる大規模な実験により、Skill-MASは顕著なパフォーマンス向上を達成するだけでなく、良好なコストパフォーマンスのトレードオフも維持できることを示した。
さらに分析したところ、メタスキルは高度に堅牢であり、目に見えないタスクと異なるLLM間で強い伝達性を示すことが明らかとなった。
関連論文リスト
- Skill is Not One-Size-Fits-All: Model-Aware Skill Alignment for LLM Agents [9.144810798419975]
LLMエージェントは、長期の対話的タスクのパフォーマンスを向上させるために、意思決定時に取得した外部キュレートされたスキル・プロデューラルな指示を徐々に取り出す。
エージェントの重みを変更することなく、各ターゲットのバックボーンにスキルを適応させるフレームワークであるMASA Model-Aware Skill Alignmentを提案する。
MASAは、最強のベースラインで最大25.8ポイントを獲得して、常に最高の総合成績を収めている。
論文 参考訳(メタデータ) (2026-05-29T01:34:42Z) - FutureMind: Equipping Small Language Models with Strategic Thinking-Pattern Priors via Adaptive Knowledge Distillation [13.855534865501369]
小型言語モデル(SLM)は、その効率的で低レイテンシな推論のため、コスト感受性とリソース制限の設定に魅力的である。
本稿では,SLMに戦略的思考パターンを付加したモジュラー推論フレームワークであるFutureMindを提案する。
論文 参考訳(メタデータ) (2026-02-01T13:26:04Z) - Learning on the Job: An Experience-Driven Self-Evolving Agent for Long-Horizon Tasks [42.78572295558531]
大規模言語モデルは、さまざまなドメインにまたがる顕著な機能を示しているが、現実の長期タスクのためのAIエージェントとしてそれらをデプロイする場合には、大きな課題が続く。
既存のLLMエージェントは、テスト時の静的であり、経験から学ぶことができず、知識を蓄積し、仕事を継続的に改善する能力が欠如している。
本稿では,階層型メモリモジュールを中心に,経験駆動型自己進化型システムを実現する新しいエージェントフレームワークであるMUSEを提案する。
論文 参考訳(メタデータ) (2025-10-09T09:40:34Z) - MARS: Optimizing Dual-System Deep Research via Multi-Agent Reinforcement Learning [82.14973479594367]
複雑な推論タスクのための大規模言語モデル(LLM)は、直感的で意図的な認知プロセスを橋渡しする革新的なアプローチを必要とする。
本稿では,Multi-Agent System for Deep ReSearch (MARS)を提案する。
論文 参考訳(メタデータ) (2025-10-06T15:42:55Z) - MCCE: A Framework for Multi-LLM Collaborative Co-Evolution [17.41200156551317]
多目的離散最適化問題は、その広大かつ非構造的な空間のために重大な問題を引き起こす。
大規模言語モデル(LLM)は、強力な先行と推論能力を提供し、専門家の知識が重要となると自然にします。
我々は,凍結したオープンソースLCMと軽量なトレーニングモデルを組み合わせたハイブリッドフレームワークであるMulti-LLM Collaborative Co-evolutionを紹介する。
論文 参考訳(メタデータ) (2025-10-06T10:03:28Z) - ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning [53.817538122688944]
Reinforced Meta-thinking Agents (ReMA) を導入し,Large Language Models (LLMs) の推論からメタ思考行動を求める。
ReMAは、推論プロセスを2つの階層的なエージェントに分解する。戦略上の監視と計画を生成するハイレベルなメタ思考エージェントと、詳細な実行のための低レベルな推論エージェントである。
単ターン実験による実験結果から、ReMAは複雑な推論タスクにおいて単エージェントRLベースラインよりも優れることが示された。
論文 参考訳(メタデータ) (2025-03-12T16:05:31Z) - Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search [57.28671084993782]
大規模言語モデル(LLM)は、様々な領域にまたがる顕著な推論能力を示している。
近年の研究では、テスト時間計算の増加はLLMの推論能力を高めることが示されている。
そこで我々は,1)COAT推論形式を内部化するための小規模な形式調整段階,2)強化学習を活用した大規模自己改善段階を提案する。
論文 参考訳(メタデータ) (2025-02-04T17:26:58Z) - MALT: Improving Reasoning with Multi-Agent LLM Training [67.76186488361685]
MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文 参考訳(メタデータ) (2024-12-02T19:30:36Z) - Weakly Supervised Temporal Action Localization via Dual-Prior Collaborative Learning Guided by Multimodal Large Language Models [33.37379526356273]
MLLM4WTALと呼ばれる新しい学習パラダイムを導入する。
MLLMのポテンシャルを利用して、時間的アクションキーセマンティクスと完全なセマンティクスの事前を提供する。
キーセマンティックマッチング(KSM)と完全セマンティック再構成(CSR)の2つの異なるモジュールを統合することでこれを実現できる。
論文 参考訳(メタデータ) (2024-11-13T09:37:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。