論文の概要: SkillMOO: Multi-Objective Optimization of Agent Skills for Software Engineering
- arxiv url: http://arxiv.org/abs/2604.09297v1
- Date: Fri, 10 Apr 2026 13:08:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.871455
- Title: SkillMOO: Multi-Objective Optimization of Agent Skills for Software Engineering
- Title(参考訳): SkillMOO: ソフトウェア工学のためのエージェントスキルの多目的最適化
- Authors: Jingzhi Gong, Ruizhen Gu, Zhiwei Fei, Yazhuo Cao, Lukas Twist, Alina Geiger, Shuo Han, Dominik Sobania, Federica Sarro, Jie M. Zhang,
- Abstract要約: SkillMOOはパスレートを最大131%改善し、最適化オーバーヘッドの低いタスク毎の最高のベースラインに対して、コストを最大32%削減する。
LLMによる編集とNSGA-IIサバイバルセレクションを用いて,自動でスキルバンドルを進化させる多目的最適化フレームワークであるSkillMOOを提案する。
3つのSkillsBenchソフトウェアエンジニアリングタスクでは、SkillMOOはパスレートを最大131%改善し、最適化オーバーヘッドの低いタスク毎の最高のベースラインに対して最大32%のコスト削減を実現している。
- 参考スコア(独自算出の注目度): 9.008257157319271
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agent skills provide modular, task-specific guidance for LLM- based coding agents, but manually tuning skill bundles to balance success rate, cost, and runtime is expensive and fragile. We present SkillMOO, a multi-objective optimization framework that automatically evolves skill bundles using LLM-proposed edits and NSGA-II survivor selection: a solver agent evaluates candidate skill bundles on coding tasks and an optimizer agent proposes bundle edits based on failure analysis. On three SkillsBench software engineering tasks, SkillMOO improves pass rate by up to 131% while reducing cost up to 32% relative to the best baseline per task at low optimization overhead. Pattern analysis reveals pruning and substitution as primary drivers of improvement, suggesting effective bundles favor minimal, focused content over accumulated instructions.
- Abstract(参考訳): エージェントスキルは、LLMベースのコーディングエージェントに対してモジュール化されたタスク固有のガイダンスを提供するが、成功率、コスト、ランタイムのバランスをとるために手動でスキルバンドルを調整することは高価で脆弱である。
本稿では,LLMが提案する編集とNSGA-IIサバイバル選択を用いて,自動でスキルバンドルを進化させる多目的最適化フレームワークであるSkillMOOについて述べる。
3つのSkillsBenchソフトウェアエンジニアリングタスクでは、SkillMOOはパスレートを最大131%改善し、最適化オーバーヘッドの低いタスク毎の最高のベースラインに対して最大32%のコスト削減を実現している。
パターン解析により、改善の原動力としてプルーニングと置換が明らかとなり、効果的なバンドルは蓄積された命令よりも最小限に焦点を絞ったコンテンツを好むことが示唆された。
関連論文リスト
- EffiSkill: Agent Skill Based Automated Code Efficiency Optimization [18.68243664364758]
EffiSkillは、LCMベースのエージェントのためのポータブルな最適化ツールボックスを構築する、コード効率最適化のためのフレームワークである。
EffiSkillは2段階の設計を採用しており、Stage IはOperatorとMeta Skillsを大規模で遅いプログラムペアからマイニングし、スキルライブラリを構築する。
ステージIIはこのライブラリを、実行不要の診断、スキル検索、計画構成、候補生成を通じて、未確認プログラムに適用する。
論文 参考訳(メタデータ) (2026-03-29T20:09:57Z) - AceGRPO: Adaptive Curriculum Enhanced Group Relative Policy Optimization for Autonomous Machine Learning Engineering [52.67783579040657]
AceGRPOは、エージェントの学習フロンティアにおけるタスクを優先順位付けして学習効率を最大化する機械学習システムである。
我々のトレーニングされたAce-30Bモデルは、MLE-Bench-Lite上で100%有効な応募率を実現し、プロプライエタリなフロンティアモデルの性能にアプローチし、より大きなオープンソースベースラインを上回ります。
論文 参考訳(メタデータ) (2026-02-08T10:55:03Z) - Rethinking LLM-Driven Heuristic Design: Generating Efficient and Specialized Solvers via Dynamics-Aware Optimization [21.449921296295884]
本研究では,コンバージェンス・アウェア・ヒューリスティックス(DASH, Dynamics-Aware Heuristics)を提案する。
DASHは、さまざまな問題スケールにわたる最先端のベースラインのソリューション品質を越えながら、ランタイム効率を3倍以上改善します。
論文 参考訳(メタデータ) (2026-01-14T05:06:42Z) - MALBO: Optimizing LLM-Based Multi-Agent Teams via Multi-Objective Bayesian Optimization [0.0]
この論文では、マルチエージェントAIチームの効率的な構成を自動化するように設計された、体系的なフレームワークであるMALBOを紹介している。
タスクの精度と推論コストの間の設定の前面を特定することを目的として,多目的最適化問題として代入課題を定式化する。
その結果、ベイズ最適化フェーズは、初期ランダム検索と比較して、平均構成コストを45%以上削減しつつ、同等な平均性能を維持した。
論文 参考訳(メタデータ) (2025-11-14T18:01:08Z) - Structured Uncertainty guided Clarification for LLM Agents [126.26213027785813]
LLMエージェントは、ツールコール機能を備えた大きな言語モデルを拡張するが、曖昧なユーザ命令は、しばしば誤った呼び出しやタスクの失敗につながる。
本稿では,ツールコールパラメータに対する構造的不確かさの定式化,完全情報の期待値(EVPI)を目標としたPOMDPのモデル化,冗長性防止のためのアスペクトベースコストモデルを提案する。
我々のSAGE-Agentは、この構造化された不確実性を活用し、より優れた効率を達成するために、曖昧なタスクのカバレッジを7~39%増加させ、明確な質問を1.5~2.7$times$に減らした。
論文 参考訳(メタデータ) (2025-11-11T21:50:44Z) - Optimizing Prompt Sequences using Monte Carlo Tree Search for LLM-Based Optimization [20.44067161623662]
大規模言語モデル(LLM)は、コード生成と構造化推論において顕著な能力を示した。
本稿では,モンテカルロ木探索によって導かれる逐次決定過程として,選択を高速化するニューラルシンボリックフレームワークを提案する。
本手法は,コード生成品質の向上を目的として,複数ステップのプロンプトシーケンスを探索・精査する。
論文 参考訳(メタデータ) (2025-08-08T04:01:24Z) - OptimAI: Optimization from Natural Language Using LLM-Powered AI Agents [8.441638148384389]
自然言語で記述された最適化問題を解くためのフレームワークであるOptimAIを紹介する。
私たちのフレームワークは、フォーミュラ、プランナー、コーダ、コード批判といった重要な役割の上に構築されています。
提案手法では,NLP4LPデータセットで88.1%,Optibenchデータセットで82.3%,エラー率で58%,エラー率で52%の精度を実現した。
論文 参考訳(メタデータ) (2025-04-23T17:45:05Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.25394449773052]
大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。
通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。
本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文 参考訳(メタデータ) (2024-10-10T17:00:06Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。