論文の概要: SkillMAS: Skill Co-Evolution with LLM-based Multi-Agent System
- arxiv url: http://arxiv.org/abs/2605.09341v1
- Date: Sun, 10 May 2026 05:43:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.199825
- Title: SkillMAS: Skill Co-Evolution with LLM-based Multi-Agent System
- Title(参考訳): SkillMAS: LLMベースのマルチエージェントシステムによるスキル共進化
- Authors: Shuai Pan, Yixiang Liu, Jiaye Gao, Te Gao, Weiwen Liu, Jianghao Lin, Zhihui Fu, Jun Wang, Weinan Zhang, Yong Yu,
- Abstract要約: 本稿では,大規模言語モデル(LLM)エージェントシステムにおける適応特殊化のための非結合フレームワークであるSkillMASを提案する。
SkillMASはUtility Learningを使用して、検証済みの実行トレースからクレジットを割り当て、未フィルタリングライブラリの成長を伴わずに再利用可能な手順を洗練するための境界付きスキル進化、障害の維持時にエビデンス付きMAS再構成、そして実行ユーティリティは構造的ミスマッチを示している。
実施された操作、コマンドライン実行、小売の他、SkillMASは報告されたハーネスの下で競争力があり、デプロイ後の専門化がどのように属性され、更新され、適用されるかを明確にしている。
- 参考スコア(独自算出の注目度): 33.2385201499106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) agent systems are increasingly expected to improve after deployment, but existing work often decouples two adaptation targets: skill evolution and multi-agent system (MAS) restructuring. This separation can create organization bottlenecks, context pressure, and mis-specialization. We present SkillMAS, a non-parametric framework for adaptive specialization in multi-agent systems that couples skill evolution with MAS restructuring. SkillMAS uses Utility Learning to assign credit from verified execution traces, bounded skill evolution to refine reusable procedures without unfiltered library growth, and evidence-gated MAS restructuring when retained failures and Executor Utility indicate a structural mismatch. Across embodied manipulation, command-line execution, and retail workflows, SkillMAS is competitive under the reported harnesses while clarifying how post-deployment specialization is attributed, updated, and applied.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントシステムは、デプロイ後に改善されることが期待されているが、既存の作業は、スキル進化とマルチエージェントシステム(MAS)再構成の2つの適応目標を分離することが多い。
この分離は、組織的なボトルネック、コンテキストプレッシャ、そして特殊化を生じさせます。
我々は,MAS再構成とスキル進化を結合したマルチエージェントシステムにおける適応特殊化のための非パラメトリックフレームワークであるSkillMASを提案する。
SkillMASはUtility Learningを使用して、検証済みの実行トレースからクレジットを割り当て、未フィルタリングライブラリの成長を伴わずに再利用可能な手順を洗練するための境界付きスキル進化、障害の維持時にエビデンス付きMAS再構成、そして実行ユーティリティは構造的ミスマッチを示している。
実施された操作、コマンドライン実行、小売ワークフロー全体にわたって、SkillMASは報告されたハーネスの下で競争力があり、デプロイ後の専門化がどのように属性され、更新され、適用されるかを明確にしている。
関連論文リスト
- Swarm Skills: A Portable, Self-Evolving Multi-Agent System Specification for Coordination Engineering [50.72456732323037]
textbfSwarm Skillsは、マルチエージェントのセマンティクスを用いて、Arthhropic Skills標準を拡張したポータブル仕様である。
Swarm Skillsはマルチエージェントを、役割、実行バウンダリ、自己進化のためのビルトインセマンティック構造からなる、一級の分散可能なアセットに変える。
我々は,Swarm Skillsがプログレッシブ開示を通じて,ゼロアダプタのクロスエージェントポータビリティを実現する方法を示す。
論文 参考訳(メタデータ) (2026-05-11T06:26:58Z) - Skill-R1: Agent Skill Evolution via Reinforcement Learning [84.35984979949502]
Skill-R1は、検証可能な報酬からインスタンスレベルの繰り返しスキル最適化のための強化学習フレームワークである。
オープンソースモデルとクローズドソースモデルの両方とのブラックボックス互換性を維持しつつ、モデルレベルの更新よりも大幅に安価に適応できる。
論文 参考訳(メタデータ) (2026-05-10T06:19:15Z) - SkillLens: Adaptive Multi-Granularity Skill Reuse for Cost-Efficient LLM Agents [6.293920920196533]
SkillLensは階層的なスキル進化フレームワークで、スキルをポリシー、戦略、手順、プリミティブの4層グラフにまとめる。
セマンティックなスキルシードを検索し、スキルグラフの次数補正されたランダムウォークを通じて拡張し、各訪問したユニットが受け入れられ、分解され、書き直され、スキップされるかどうかを検証器を使って決定する。
MuLocbenchとALFWorld全体で、SkillLensは、強いスキルベースのベースラインよりも一貫して改善されている。
論文 参考訳(メタデータ) (2026-05-08T18:48:04Z) - DIMoE-Adapters: Dynamic Expert Evolution for Continual Learning in Vision-Language Models [63.58458696122293]
継続的な学習は、視覚言語モデルが知識を蓄積し、スクラッチから再トレーニングすることなく、進化するタスクに適応することを可能にする。
既存のほとんどのメソッドは、静的に割り当てられたパラメータを持つ固定されたアーキテクチャに依存しており、新しいドメインへの適応を制限し、破滅的な忘れを増す。
動的インクリメンタル・ミックス・オブ・エキスパート・アダプタ・フレームワークであるDIMoE-Adaptersを提案する。
論文 参考訳(メタデータ) (2026-05-08T09:32:05Z) - Towards Adaptive Continual Model Merging via Manifold-Aware Expert Evolution [33.44708543696699]
MADE-ITは、多様体幾何学における本質的な専門家表現を基礎にして、専門家の管理と活性化をオーケストレーションする。
実験により、MADE-ITは、長い水平およびシャッフルされたタスクシーケンスの精度と堅牢性において、強いベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-04-24T11:35:53Z) - EvoSkills: Self-Evolving Agent Skills via Co-Evolutionary Verification [85.3692584167951]
Anthropicは、LLMエージェントが多段階のプロフェッショナルタスクに取り組むためのスキルの概念を提案する。
ツールは単一の自己完結型関数であり、スキルは相互依存型多ファイルアーティファクトの構造化バンドルである。
EvoSkillsは、エージェントが複雑なマルチファイルスキルパッケージを自律的に構築できる自己進化型スキルフレームワークである。
論文 参考訳(メタデータ) (2026-04-02T06:43:20Z) - Towards AGI A Pragmatic Approach Towards Self Evolving Agent [0.0]
大規模言語モデル(LLM)ベースのエージェントは、デプロイ後、強力だが基本的に静的である。
本研究では,Base LLM,運用SLMエージェント,Code-Generation LLM,Teacher-LLMを統合した階層的自己進化型マルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-15T20:43:44Z) - DIVE into MoE: Diversity-Enhanced Reconstruction of Large Language Models from Dense into Mixture-of-Experts [16.816404016099202]
Mixture-of-Experts (MoE)アーキテクチャを持つ大規模言語モデル(LLM)は、パラメータのサブセットを選択的に活性化することにより、高いコスト効率を達成する。
MoE LLMの推論効率にもかかわらず、スクラッチからの豊富な専門家の訓練はかなりのオーバーヘッドを引き起こす。
DIVEという多様性向上手法を提案する。
DIVEはトレーニング効率を最小限の精度で達成し、既存のプルーニング法とMoE再構成法を同じ数のアクティベートパラメータで上回る。
論文 参考訳(メタデータ) (2025-06-11T03:05:24Z) - Multi-Agent Collaboration via Evolving Orchestration [55.574417128944226]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。
EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2024-06-20T11:49:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。