論文の概要: Inducing Programmatic Skills for Agentic Tasks
- arxiv url: http://arxiv.org/abs/2504.06821v1
- Date: Wed, 09 Apr 2025 12:25:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:06:45.515534
- Title: Inducing Programmatic Skills for Agentic Tasks
- Title(参考訳): エージェントタスクのためのプログラムスキルの導入
- Authors: Zora Zhiruo Wang, Apurva Gandhi, Graham Neubig, Daniel Fried,
- Abstract要約: 本研究では,エージェントがプログラムベースのスキルをその場で誘導し,検証し,活用することで,エージェントの適応を可能にするエージェントスキル誘導(ASI)を提案する。
ASIは静的ベースラインエージェントとテキストスキルを23.5%、成功率11.3%で上回っている。
- 参考スコア(独自算出の注目度): 53.964176411616
- License:
- Abstract: To succeed in common digital tasks such as web navigation, agents must carry out a variety of specialized tasks such as searching for products or planning a travel route. To tackle these tasks, agents can bootstrap themselves by learning task-specific skills online through interaction with the web environment. In this work, we demonstrate that programs are an effective representation for skills. We propose agent skill induction (ASI), which allows agents to adapt themselves by inducing, verifying, and utilizing program-based skills on the fly. We start with an evaluation on the WebArena agent benchmark and show that ASI outperforms the static baseline agent and its text-skill counterpart by 23.5% and 11.3% in success rate, mainly thanks to the programmatic verification guarantee during the induction phase. ASI also improves efficiency by reducing 10.7-15.3% of the steps over baselines, by composing primitive actions (e.g., click) into higher-level skills (e.g., search product). We then highlight the efficacy of ASI in remaining efficient and accurate under scaled-up web activities. Finally, we examine the generalizability of induced skills when transferring between websites, and find that ASI can effectively reuse common skills, while also updating incompatible skills to versatile website changes.
- Abstract(参考訳): Webナビゲーションのような一般的なデジタルタスクを成功させるためには、エージェントは製品検索や旅行ルートの計画など、様々な専門的なタスクを実行しなければならない。
これらのタスクに対処するために、エージェントは、Web環境とのインタラクションを通じて、タスク固有のスキルをオンラインで学習することで、自分自身をブートストラップすることができる。
本研究では,プログラムがスキルの効果的な表現であることを示す。
我々はエージェントスキル誘導(ASI)を提案し、エージェントはプログラムベースのスキルをその場で誘導し、検証し、活用することができる。
まず、WebArenaエージェントベンチマークの評価から、ASIが静的ベースラインエージェントとそのテキストスキルを23.5%、11.3%向上させることを示す。
ASIはまた、ベースラインを越えるステップの10.7-15.3%を減らし、プリミティブアクション(例えば、クリック)をより高いレベルのスキル(例えば、検索製品)に構成することで効率を向上させる。
次に、スケールアップしたWeb活動において、効率的かつ正確なASIの有効性を強調した。
最後に、Webサイト間の移動における誘導的スキルの一般化性について検討し、ASIが共通スキルを効果的に再利用できるとともに、Webサイトの変更に不適合なスキルを更新できることを見出した。
関連論文リスト
- Agent Workflow Memory [71.81385627556398]
本稿では、一般的に再利用されるルーチンを誘導するAgent Memoryを紹介する。
AWMはベースラインの結果を24.6%、相対的な成功率51.1%で大幅に改善する。
オンラインAWMは、クロスタスク、ウェブサイト、ドメイン評価を強力に一般化する。
論文 参考訳(メタデータ) (2024-09-11T17:21:00Z) - KOI: Accelerating Online Imitation Learning via Hybrid Key-state Guidance [51.09834120088799]
キーステートガイド付きオンライン模倣(KOI)学習手法について紹介する。
我々は視覚言語モデルを用いて、専門家の軌跡から意味的キー状態を抽出し、「何をすべきか」の目的を示す。
セマンティックキー状態間の間隔内では、動作キー状態の捕捉に光流が使用され、「どうするか」のメカニズムが理解される。
論文 参考訳(メタデータ) (2024-08-06T02:53:55Z) - Affordance-Guided Reinforcement Learning via Visual Prompting [51.361977466993345]
Keypoint-based Affordance Guidance for Improvements (KAGI) は、視覚言語モデル(VLM)によって形成される報酬を自律的なRLに活用する手法である。
自然言語記述によって指定された実世界の操作タスクにおいて、KAGIは自律的なRLのサンプル効率を改善し、30Kのオンライン微調整ステップでタスク完了を成功させる。
論文 参考訳(メタデータ) (2024-07-14T21:41:29Z) - Tactile Active Inference Reinforcement Learning for Efficient Robotic
Manipulation Skill Acquisition [10.072992621244042]
触覚能動推論強化学習(Tactile Active Inference Reinforcement Learning, Tactile-AIRL)と呼ばれるロボット操作におけるスキル学習手法を提案する。
強化学習(RL)の性能を高めるために,モデルに基づく手法と本質的な好奇心をRLプロセスに統合した能動推論を導入する。
本研究では,タスクをプッシュする非包括的オブジェクトにおいて,学習効率が著しく向上することが実証された。
論文 参考訳(メタデータ) (2023-11-19T10:19:22Z) - Variational Curriculum Reinforcement Learning for Unsupervised Discovery
of Skills [25.326624139426514]
本稿では,VUVC(Value Uncertainty Vari Curriculum Curriculum)と呼ばれる情報理論に基づく教師なしスキル発見手法を提案する。
規則性条件下では、VUVCは、均一なカリキュラムに比べて訪問状態のエントロピーの増加を加速させる。
また,本手法によって発見された技術は,ゼロショット設定で現実のロボットナビゲーションタスクを達成できることを実証した。
論文 参考訳(メタデータ) (2023-10-30T10:34:25Z) - Human-Timescale Adaptation in an Open-Ended Task Space [56.55530165036327]
大規模にRLエージェントを訓練することで、オープンエンドの新規な3D問題に人間と同じくらい早く適応できる一般的なコンテキスト内学習アルゴリズムが実現可能であることを示す。
我々の研究は、より大規模で適応的なRLエージェントの基礎を築いた。
論文 参考訳(メタデータ) (2023-01-18T15:39:21Z) - Design of Negative Sampling Strategies for Distantly Supervised Skill
Extraction [19.43668931500507]
本稿では,リテラルマッチングによる遠隔監視に基づく,スキル抽出のためのエンドツーエンドシステムを提案する。
ESCO分類を用いて、関連するスキルからネガティブな例を選択することで、最大の改善が得られます。
我々は,タスクのさらなる研究を促進するために,研究目的のベンチマークデータセットをリリースする。
論文 参考訳(メタデータ) (2022-09-13T13:37:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。