論文の概要: WebDART: Dynamic Decomposition and Re-planning for Complex Web Tasks
- arxiv url: http://arxiv.org/abs/2510.06587v1
- Date: Wed, 08 Oct 2025 02:34:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.265456
- Title: WebDART: Dynamic Decomposition and Re-planning for Complex Web Tasks
- Title(参考訳): WebDART: 複雑なWebタスクの動的分解と再計画
- Authors: Jingbo Yang, Bairu Hou, Wei Wei, Shiyu Chang, Yujia Bao,
- Abstract要約: 大規模言語モデル(LLM)エージェントは、簡単なWebタスクには適しているが、長い地平線ナビゲーション、大規模な情報抽出、制約下での推論といった目的に苦労している。
本稿では,単一 LLM でこのような複雑な雑用を処理できる汎用フレームワーク WebDART を提案する。
WebDARTは、従来のSOTAエージェントよりも最大13.7%成功率を引き上げ、WebArenaスイートのパフォーマンスにマッチする。
- 参考スコア(独自算出の注目度): 30.48395228595732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) agents are becoming competent at straightforward web tasks, such as opening an item page or submitting a form, but still struggle with objectives that require long horizon navigation, large scale information extraction, and reasoning under constraints. We present WebDART, a general framework that enables a single LLM to handle such complex chores. WebDART (i) dynamically decomposes each objective into three focused subtasks: navigation, information extraction, and execution, so the model concentrates on one skill at a time, and (ii) continuously replans the decomposition as new webpages are revealed, taking advantage of newly discovered filters or shortcuts and avoiding redundant exploration. Evaluated on WebChoreArena, WebDART lifts success rates by up to 13.7 percentage points over previous SOTA agents, while matching their performance on the easier WebArena suite and completing tasks with up to 14.7 fewer navigation steps.
- Abstract(参考訳): 大きな言語モデル(LLM)エージェントは、アイテムページを開いたりフォームを提出したりといった簡単なWebタスクに適しているが、長い地平線ナビゲーション、大規模な情報抽出、制約下での推論といった目的に苦戦している。
本稿では,単一 LLM でこのような複雑な雑用を処理できる汎用フレームワーク WebDART を提案する。
WebDART
(i)各目的を3つのサブタスク(ナビゲーション、情報抽出、実行)に動的に分解するので、モデルは一度に1つのスキルに集中する。
(II) 新たに発見されたフィルタやショートカットを利用して, 新たなWebページが明らかにされるにつれて, 分解を継続的に再設計し, 冗長な探索を回避する。
WebChoreArenaで評価されたWebDARTは、従来のSOTAエージェントよりも最大13.7%の成功率を引き上げ、WebArenaスイートでの彼らのパフォーマンスと最大14.7のナビゲーションステップでタスクを完了させた。
関連論文リスト
- WebChoreArena: Evaluating Web Browsing Agents on Realistic Tedious Web Tasks [31.201406205897143]
WebChoreArenaは、532の精査されたタスクからなる、完全に再現可能な新しいベンチマークである。
WebChoreArenaは、完全に再現可能で広く採用されている4つのWebArenaシミュレーション環境の上に構築されている。
WebChoreArena で LLM が進化するにつれて, 性能が大幅に向上することが実証された。
論文 参考訳(メタデータ) (2025-06-02T17:59:45Z) - WebNav: An Intelligent Agent for Voice-Controlled Web Navigation [0.0]
WebNavはマルチモーダルなWebナビゲーションのための新しいエージェントである。
システムは、スクリーンショットからの視覚ベースのコンテキストと動的DOMラベルのブラウザ拡張を組み合わせる。
論文 参考訳(メタデータ) (2025-03-18T02:33:27Z) - R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory [53.94879482534949]
現在のモデルは、Web構造の可視化と理解が限られているため、効率的なナビゲーションとアクション実行に苦しむことが多い。
提案したR2D2フレームワークは,2つのパラダイムを統合することで,これらの課題に対処する。
本研究は,記憶を増強したナビゲーションと反射学習を組み合わせることで,Webエージェントの能力が向上することが示唆された。
論文 参考訳(メタデータ) (2025-01-21T20:21:58Z) - Infogent: An Agent-Based Framework for Web Information Aggregation [59.67710556177564]
我々はWeb情報集約のための新しいフレームワークInfogentを紹介する。
異なる情報アクセス設定の実験では、Infogentが既存のSOTAマルチエージェント検索フレームワークを7%上回った。
論文 参考訳(メタデータ) (2024-10-24T18:01:28Z) - NaviQAte: Functionality-Guided Web Application Navigation [6.0759036120654315]
NaviQAteは、Webアプリケーションの探索を質問と回答のタスクとして捉え、詳細なパラメータを必要とせずに機能のためのアクションシーケンスを生成する。
我々の3段階のアプローチでは、GPT-4oのような先進的な言語モデルを用いて複雑な意思決定を行い、GPT-4o miniのようなコスト効率のよいモデルを用いる。
論文 参考訳(メタデータ) (2024-09-16T21:18:39Z) - AutoWebGLM: A Large Language Model-based Web Navigating Agent [33.55199326570078]
オープンなAutoWebGLMをChatGLM3-6Bに基づいて開発する。
人間のブラウジングパターンにインスパイアされた我々は、まず、Webページを表現するためのHTML単純化アルゴリズムを設計する。
次に,カリキュラム学習のためのWebブラウジングデータを構築するために,ハイブリッドなヒューマンAI手法を用いる。
論文 参考訳(メタデータ) (2024-04-04T17:58:40Z) - Easy-to-Hard Learning for Information Extraction [57.827955646831526]
情報抽出システムは、構造化されていないテキストから構造化された情報を自動的に抽出することを目的としている。
本稿では,3段階,すなわち易解な段階,難解な段階,主段階の3段階からなる統合型易解学習フレームワークを提案する。
学習プロセスを複数の段階に分割することで,一般のIEタスク知識の獲得と一般化能力の向上が促進される。
論文 参考訳(メタデータ) (2023-05-16T06:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。