論文の概要: SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
- arxiv url: http://arxiv.org/abs/2504.07079v1
- Date: Wed, 09 Apr 2025 17:51:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 13:33:26.832635
- Title: SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
- Title(参考訳): SkillWeaver: Web Agentsはスキルの発見と獲得によって自己改善が可能
- Authors: Boyuan Zheng, Michael Y. Fatemi, Xiaolong Jin, Zora Zhiruo Wang, Apurva Gandhi, Yueqi Song, Yu Gu, Jayanth Srinivasa, Gaowen Liu, Graham Neubig, Yu Su,
- Abstract要約: SkillWeaverは、再利用可能なスキルをAPIとして自律的に合成することで、Webエージェントの自己改善を可能にするスキル中心のフレームワークです。
新しいウェブサイトが与えられると、エージェントは自律的にスキルを発見し、実践のために実行し、実践経験を堅牢なAPIに蒸留する。
WebArenaと実世界のWebサイトでの実験は、SkillWeaverの有効性を示し、それぞれ31.8%と39.8%の相対的な成功率の向上を達成した。
- 参考スコア(独自算出の注目度): 48.05057798832005
- License:
- Abstract: To survive and thrive in complex environments, humans have evolved sophisticated self-improvement mechanisms through environment exploration, hierarchical abstraction of experiences into reuseable skills, and collaborative construction of an ever-growing skill repertoire. Despite recent advancements, autonomous web agents still lack crucial self-improvement capabilities, struggling with procedural knowledge abstraction, refining skills, and skill composition. In this work, we introduce SkillWeaver, a skill-centric framework enabling agents to self-improve by autonomously synthesizing reusable skills as APIs. Given a new website, the agent autonomously discovers skills, executes them for practice, and distills practice experiences into robust APIs. Iterative exploration continually expands a library of lightweight, plug-and-play APIs, significantly enhancing the agent's capabilities. Experiments on WebArena and real-world websites demonstrate the efficacy of SkillWeaver, achieving relative success rate improvements of 31.8% and 39.8%, respectively. Additionally, APIs synthesized by strong agents substantially enhance weaker agents through transferable skills, yielding improvements of up to 54.3% on WebArena. These results demonstrate the effectiveness of honing diverse website interactions into APIs, which can be seamlessly shared among various web agents.
- Abstract(参考訳): 複雑な環境で生き残り、繁栄するために、人間は環境探索、経験の階層的な抽象化から再利用可能なスキルへの抽象化、成長を続けるスキルレパートリーの協調構築を通じて、洗練された自己改善メカニズムを進化させてきた。
近年の進歩にもかかわらず、自律的なウェブエージェントには重要な自己改善能力がなく、手続き的な知識の抽象化、精巧な技術、スキル構成に苦慮している。
本研究では,再利用可能なスキルをAPIとして自律的に合成することで,エージェントの自己改善を可能にするスキル中心のフレームワークであるSkillWeaverを紹介する。
新しいウェブサイトが与えられると、エージェントは自律的にスキルを発見し、実践のために実行し、実践経験を堅牢なAPIに蒸留する。
反復探索は、軽量でプラグアンドプレイのAPIライブラリを継続的に拡張し、エージェントの機能を大幅に強化する。
WebArenaと実世界のWebサイトでの実験は、SkillWeaverの有効性を示し、それぞれ31.8%と39.8%の相対的な成功率の向上を達成した。
さらに、強力なエージェントによって合成されたAPIは、転送可能なスキルを通じて、より弱いエージェントを大幅に強化し、WebArenaで最大54.3%の改善を実現した。
これらの結果は、様々なWebエージェント間でシームレスに共有できる、多様なWebサイトインタラクションをAPIに組み込むことの有効性を示す。
関連論文リスト
- Skill Expansion and Composition in Parameter Space [17.016614374151747]
Parametric Skill Expansion and Composition (PSEC)はエージェントの能力を反復的に進化させるように設計された新しいフレームワークである。
PSECは、事前知識を活用して、新しい課題に効果的に取り組む能力が優れている。
論文 参考訳(メタデータ) (2025-02-09T15:22:38Z) - OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization [66.22117723598872]
マルチモーダルWebエージェントの開発を容易にするために設計されたオープンソースフレームワークを紹介する。
まず、基本モデルを模倣学習で訓練し、基礎能力を得る。
次に、エージェントにオープンウェブを探索させ、その軌道に関するフィードバックを収集する。
論文 参考訳(メタデータ) (2024-10-25T15:01:27Z) - Disentangled Unsupervised Skill Discovery for Efficient Hierarchical Reinforcement Learning [39.991887534269445]
Disentangled Unsupervised Skill Discovery (DUSDi) は、下流の課題を解決するために効率的に再利用できる非角スキルの学習方法である。
DUSDiはスキルを切り離したコンポーネントに分解し、各スキルコンポーネントは状態空間の1つの要素にのみ影響する。
DUSDiは、障害のあるスキルをうまく学習し、下流タスクの解決に学習したスキルを適用するという点で、従来のスキル発見方法よりもはるかに優れています。
論文 参考訳(メタデータ) (2024-10-15T04:13:20Z) - RoboAgent: Generalization and Efficiency in Robot Manipulation via
Semantic Augmentations and Action Chunking [54.776890150458385]
マルチタスク操作能力を持つユニバーサルエージェントを訓練するための効率的なシステムを開発した。
私たちは、12のスキルを持つ1つのエージェントを訓練することができ、38のタスクでその一般化を実証することができます。
平均すると、RoboAgentは目に見えない状況において、従来の方法よりも40%以上性能が高い。
論文 参考訳(メタデータ) (2023-09-05T03:14:39Z) - WebArena: A Realistic Web Environment for Building Autonomous Agents [92.3291458543633]
我々は、非常に現実的で再現可能な言語誘導エージェントのための環境を構築する。
我々は,Web上でタスクを実行するエージェントに着目し,4つの共通ドメインから完全に機能するWebサイトを持つ環境を構築する。
タスク完了の関数的正しさを評価することに焦点を当てたベンチマークタスクのセットをリリースする。
論文 参考訳(メタデータ) (2023-07-25T22:59:32Z) - Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。
提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。
Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文 参考訳(メタデータ) (2022-11-23T23:31:14Z) - Residual Skill Policies: Learning an Adaptable Skill-based Action Space
for Reinforcement Learning for Robotics [18.546688182454236]
スキルベース強化学習(RL)は、ロボット学習の加速に先行知識を活用するための有望な戦略として登場した。
本研究では,状態条件付き生成モデルを用いて,スキル空間における探索を高速化する手法を提案する。
我々は4つの困難な操作タスクにまたがってアプローチを検証する。
論文 参考訳(メタデータ) (2022-11-04T02:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。