論文の概要: Bilevel Optimization of Agent Skills via Monte Carlo Tree Search
- arxiv url: http://arxiv.org/abs/2604.15709v1
- Date: Fri, 17 Apr 2026 05:31:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.748375
- Title: Bilevel Optimization of Agent Skills via Monte Carlo Tree Search
- Title(参考訳): モンテカルロ木探索によるエージェントスキルの2レベル最適化
- Authors: Chenyi Huang, Haoting Zhang, Jingxu Xu, Zeyu Zheng, Yunduan Lin,
- Abstract要約: Agent textttskillsは、構造化された命令、ツール、サポートリソースのコレクションである。
本稿では,外部ループがモンテカルロ木探索を用いてテキストレットスキル構造を決定する二段階最適化フレームワークを提案する。
提案するフレームワークをオープンソースのOperations Research Question Answeringデータセットで評価する。
- 参考スコア(独自算出の注目度): 10.545412677210836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agent \texttt{skills} are structured collections of instructions, tools, and supporting resources that help large language model (LLM) agents perform particular classes of tasks. Empirical evidence shows that the design of \texttt{skills} can materially affect agent task performance, yet systematically optimizing \texttt{skills} remains challenging. Since a \texttt{skill} comprises instructions, tools, and supporting resources in a structured way, optimizing it requires jointly determining both the structure of these components and the content each component contains. This gives rise to a complex decision space with strong interdependence across structure and components. We therefore represent these two coupled decisions as \texttt{skill} structure and component content, and formulate \texttt{skill} optimization as a bilevel optimization problem. We propose a bilevel optimization framework in which an outer loop employs Monte Carlo Tree Search to determine the \texttt{skill} structure, while an inner loop refines the component content within the structure selected by the outer loop. In both loops, we employ LLMs to assist the optimization procedure. We evaluate the proposed framework on an open-source Operations Research Question Answering dataset, and the experimental results suggest that the bilevel optimization framework improves the performance of the agents with the optimized \texttt{skill}.
- Abstract(参考訳): Agent \texttt{skills}は、大きな言語モデル(LLM)エージェントが特定のタスクのクラスを実行するのに役立つ、命令、ツール、サポートリソースの構造化されたコレクションである。
実証的な証拠は、 \texttt{skills} の設計がエージェントタスクのパフォーマンスに実質的に影響を及ぼすが、体系的に \texttt{skills} を最適化することは困難であることを示している。
texttt{skill}は命令、ツール、そしてリソースを構造化された方法で構成するので、それを最適化するには、これらのコンポーネントの構造と各コンポーネントが含むコンテンツの両方を共同で決定する必要がある。
これにより、構造やコンポーネント間の強い相互依存を持つ複雑な決定空間が生まれる。
したがって、これら2つの結合した決定を「texttt{skill} 構造」と「コンポーネント内容」として表現し、二段階最適化問題として「texttt{skill} 最適化」を定式化する。
本稿では,外ループがモンテカルロ木探索を用いて,内ループが外ループによって選択された構造内のコンポーネント内容を洗練するのに対して,内ループが内ループが<texttt{skill}構造を決定するための二段階最適化フレームワークを提案する。
どちらのループでも、最適化手順を支援するためにLLMを用いる。
提案したフレームワークをオープンソースのOperations Research Question Answeringデータセットで評価し,両レベル最適化フレームワークが最適化された‘texttt{skill}’でエージェントの性能を向上させることを実験的に示唆した。
関連論文リスト
- CSPO: Alleviating Reward Ambiguity for Structured Table-to-LaTeX Generation [45.77327540645401]
本稿では, コンポーネント構造, スタイル, コンテント間の最適化を両立させるフレームワークCSPOを提案する。
CSPOはコンポーネント固有の報酬を割り当て、各シグナルをそのコンポーネントに関連するトークンを通してのみバックプロパゲーションする。
論文 参考訳(メタデータ) (2026-04-13T02:34:30Z) - Structural Segmentation of the Minimum Set Cover Problem: Exploiting Universe Decomposability for Metaheuristic Optimization [1.1011268090482575]
最小設定被覆問題(英: Minimum Set Cover Problem、MSCP)は、科学と工学に多くの応用がある古典的なNPハード最適化問題である。
本研究は,MSCPにおける直交セグメント性の概念を考察し,本質的な構造的分解をどのように活用して本質的な最適化を向上するかを考察する。
論文 参考訳(メタデータ) (2026-01-29T14:02:48Z) - Modular Prompt Optimization: Optimizing Structured Prompts with Section-Local Textual Gradients [0.8604557306886812]
本稿では,プロンプトを固定的なセマンティックセクションで構成される構造化オブジェクトとして扱うスキーマベースのプロンプト最適化フレームワークを提案する。
LLaMA-3 8B-Instruct と Mistral-7B-Instruct をソルバモデルとして用いて, ARC-Challenge と MMLU の2つの推論ベンチマークでMPOを評価した。
論文 参考訳(メタデータ) (2026-01-07T16:20:08Z) - STARE at the Structure: Steering ICL Exemplar Selection with Structural Alignment [24.80531387685099]
本稿では,効率,一般化性,性能のバランスを保った2段階の模範選択戦略を提案する。
まず、BERTベースのレトリバーを構造意識の監視を用いて微調整し、意味論的に関連性があり構造的に整合した模範を選定する。
次に,隠れ表現において構文的に意味のある情報を増幅するプラグインモジュールを用いて,検索機能を強化した。
論文 参考訳(メタデータ) (2025-08-28T16:04:39Z) - Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases [78.62158923194153]
テキストリッチなグラフ知識ベース(TG-KB)は、テキストおよび構造的知識を提供することで、クエリに応答する上でますます重要になっている。
本研究では,これら2種類の知識を計画・推論・組織化フレームワークを用いて検索するための構造・テキスト検索(MoR)の混合を提案する。
論文 参考訳(メタデータ) (2025-02-27T17:42:52Z) - StructGPT: A General Framework for Large Language Model to Reason over
Structured Data [117.13986738340027]
我々は,構造化データに基づく質問応答タスクの解法として,emphIterative Reading-then-Reasoning(IRR)アプローチを開発した。
提案手法はChatGPTの性能を大幅に向上させ,全データの教師付きベースラインに対して同等のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-05-16T17:45:23Z) - Form2Seq : A Framework for Higher-Order Form Structure Extraction [14.134131448981295]
テキストを用いた構造抽出のための新しいシーケンス・ツー・シーケンス(Seq2Seq)を提案する。
1)フィールドキャプション,リスト項目などの下位要素を10種類に分類すること,2)テキストフィールド,チョイスフィールド,チョイスグループなどの下位要素を情報収集機構として使用する高次構成要素に分類すること,の2つの課題について論じる。
実験結果から, 分類作業の精度90%, F1が75.82, 86.01, 61.63のテキストベースアプローチの有効性が示された。
論文 参考訳(メタデータ) (2021-07-09T13:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。