論文の概要: SkillDAG: Self-Evolving Typed Skill Graphs for LLM Skill Selection at Scale
- arxiv url: http://arxiv.org/abs/2606.03056v1
- Date: Tue, 02 Jun 2026 02:45:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 10:57:21.716921
- Title: SkillDAG: Self-Evolving Typed Skill Graphs for LLM Skill Selection at Scale
- Title(参考訳): SkillDAG: LLMスキル選択のための自己進化型型スキルグラフ
- Authors: Tong Bai, Zhenglin Wan, Pengfei Zhou, Xingrui Yu, Wangbo Zhao, Yang You, Ivor W. Tsang,
- Abstract要約: 本稿では,スキル間関係を型付き有向グラフとしてモデル化したSkillDAGを提案する。
各検索はベクトルマッチング、型付きエッジ隣人、競合信号を返す。
ALFWorldとSkillsBench with MiniMax-M2.7では、SkillDAGは67.1%の成功と27.3%の報酬を得た。
- 参考スコア(独自算出の注目度): 54.70985426016736
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As LLM agents adopt large skill libraries, selecting the right subset becomes a structural problem rather than a similarity-matching one: skills depend on, conflict with, specialize, or duplicate one another, a structure invisible to both full enumeration and embedding similarity. We present SkillDAG, which models inter-skill relationships as a typed directed graph and exposes it to an LLM agent as an inference-time, agent-callable structural retrieval interface, queried and evolved during execution rather than baked into a fixed retrieval pipeline: each search returns vector matches, typed-edge neighbors, and conflict signals, and a propose-then-commit protocol lets the agent register execution-backed edges so the graph accumulates structure across episodes. On ALFWorld and SkillsBench with MiniMax-M2.7, SkillDAG reaches 67.1% success and 27.3% reward, exceeding the strongest reported Graph-of-Skills baseline by +12.8 and +8.6 points; the advantage ports to gpt-5.2-codex, and intrinsic SkillsBench Ret@K rises from 65.5 to 78.2 under matched queries. These gains trace to isolable mechanisms: candidate ranking that stays robust as the pool grows 10x where a fixed seeding-diffusion pipeline degrades, and set-monotone online edits that enlarge ground-truth recall without evicting prior hits.
- Abstract(参考訳): LLMエージェントが大きなスキルライブラリを採用すると、適切なサブセットを選択することは、類似性にマッチするものではなく、構造的な問題となる。
本稿では,SkillDAGを提案する。SkillDAGは,言語間関係を型付き有向グラフとしてモデル化し,LLMエージェントにエージェントコール可能な構造検索インタフェースとして公開し,各検索がベクトルマッチング,型付きエッジ隣人,競合信号を返すという,固定された検索パイプラインに格納されるのではなく,実行中にクエリされ,進化する。
ALFWorldとSkillsBench with MiniMax-M2.7では、SkillDAGは67.1%の成功と27.3%の報酬を達成し、最強のGraph-of-Skillsベースラインを+12.8と+8.6ポイント越え、gpt-5.2-codexとintrinsic SkillsBench Ret@Kは65.5から78.2に上昇した。
プールが10倍に成長するにつれて堅牢な候補ランキングが保たれ、固定されたシード拡散パイプラインが劣化する。
関連論文リスト
- PersonalAI 2.0: Enhancing knowledge graph traversal/retrieval with planning mechanism for Personalized LLM Agents [53.369140518949656]
外部知識グラフ(KG)の統合により,大規模言語モデル(LLM)ベースのシステムを強化する新しいフレームワークであるPersonalAI 2.0(PAI-2)を紹介する。
提案手法は,動的でマルチステージなクエリ処理パイプラインを組み込むことにより,既存のGraphRAG(Retrieval-Augmented Generation)メソッドの重要な制限に対処する。
グラフアルゴリズム(例えば、BeamSearch、WaterCircles)は、平均6%の標準フラットテンレトリバーよりも優れた結果が得られる一方で、検索計画強化機構は、6つのデータセットにわたるLLM-as-a-Judgeによる障害アルゴリズムに比べて18%向上することを示す。
論文 参考訳(メタデータ) (2026-05-13T13:06:30Z) - SkillGraph: Skill-Augmented Reinforcement Learning for Agents via Evolving Skill Graphs [70.1970574147839]
有向グラフのノードとして再利用可能なスキルを表現するフレームワークであるSKILLGRAPHを提案する。
SKILLGRAPHは個々のスキルだけでなく、多段階意思決定をガイドできる順序付きスキルサブグラフも取得する。
実験により,SKILLGRAPHはメモリ拡張RL法に対して最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2026-05-12T12:21:49Z) - MCPShield: Content-Aware Attack Detection for LLM Agent Tool-Call Traffic [1.827510863075184]
Model Context Protocol (MCP) は、エージェントが外部ツールを呼び出すために広く採用されているインタフェースである。
MCPは、各エージェントセッションをグラフとしてエンコードするMCPツールコールトラフィックのアタックフレームワークとして提示される。
論文 参考訳(メタデータ) (2026-05-11T14:55:48Z) - GraSP: Graph-Structured Skill Compositions for LLM Agents [29.818044584102456]
LLMエージェントのスキルエコシステムは急速に成熟しているが、最近のベンチマークでは、より多くのスキルを提供するエージェントはパフォーマンスを単調に改善しない。
スキル検索と実行の間にコンパイル層を導入する最初の実行可能なスキルグラフアーキテクチャであるGraSPを提案する。
GraSPは、フラットスキルセットをプレコンディションエフェクトエッジで型付き有向非巡回グラフ(DAG)に変換し、ノードレベルの検証でそれらを実行し、5つの型付き演算子を通して局所性バウンドな修復を行う。
論文 参考訳(メタデータ) (2026-04-20T06:31:11Z) - SAGE: Structure Aware Graph Expansion for Retrieval of Heterogeneous Data [47.930782177987446]
不均一なコーパスに答える検索拡張された質問は、テキスト、テーブル、グラフノード間で接続されたエビデンスを必要とする。
標準レトリバーリーダーパイプラインは、独立にチャンクされたテキスト上の平坦な類似性検索を使用し、モダリティ間のマルチホップエビデンスチェーンを欠いている。
SAGE(Structure Aware Graph Expansion)フレームワークを提案する。これは、パーセンタイルベースのプルーニングとメタデータ駆動の類似性を利用して、チャンクレベルのグラフをオフラインで構築する。
暗黙的クロスモーダルコーパスと明示的スキーマグラフのエージェント検索であるSPARK(Structure Aware Planning Agent for Retrieval over Knowledge Graphs)のハイブリッド高密度スパース検索を用いて初期検索をインスタンス化する。
論文 参考訳(メタデータ) (2026-02-18T23:57:19Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - BifrostRAG: Bridging Dual Knowledge Graphs for Multi-Hop Question Answering in Construction Safety [11.079426930790458]
多くのコンプライアンス関連のクエリはマルチホップであり、リンクされた節間で情報を合成する必要がある。
これは、従来の検索拡張世代(RAG)システムにとっての課題である。
本稿では、言語関係と文書構造の両方を明示的にモデル化した二重グラフRAG統合システムであるBifrostRAGを紹介する。
論文 参考訳(メタデータ) (2025-07-18T03:39:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。