論文の概要: Branch-and-Browse: Efficient and Controllable Web Exploration with Tree-Structured Reasoning and Action Memory
- arxiv url: http://arxiv.org/abs/2510.19838v1
- Date: Sat, 18 Oct 2025 00:45:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.320808
- Title: Branch-and-Browse: Efficient and Controllable Web Exploration with Tree-Structured Reasoning and Action Memory
- Title(参考訳): ブランチ・アンド・ブラウズ:木構造推論とアクションメモリによる効率的かつ制御可能なWeb探索
- Authors: Shiqi He, Yue Cui, Xinyu Ma, Yaliang Li, Bolin Ding, Mosharaf Chowdhury,
- Abstract要約: Branch-and-Browseは構造化推論処理、コンテキスト記憶、効率的な実行を統一する、きめ細かいWebエージェントフレームワークである。
WebArenaベンチマークでは、Branch-and-Browseはタスク成功率35.8%を達成し、最先端の手法と比較して実行時間を最大40.4%削減している。
- 参考スコア(独自算出の注目度): 69.49061918994882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous web agents powered by large language models (LLMs) show strong potential for performing goal-oriented tasks such as information retrieval, report generation, and online transactions. These agents mark a key step toward practical embodied reasoning in open web environments. However, existing approaches remain limited in reasoning depth and efficiency: vanilla linear methods fail at multi-step reasoning and lack effective backtracking, while other search strategies are coarse-grained and computationally costly. We introduce Branch-and-Browse, a fine-grained web agent framework that unifies structured reasoning-acting, contextual memory, and efficient execution. It (i) employs explicit subtask management with tree-structured exploration for controllable multi-branch reasoning, (ii) bootstraps exploration through efficient web state replay with background reasoning, and (iii) leverages a page action memory to share explored actions within and across sessions. On the WebArena benchmark, Branch-and-Browse achieves a task success rate of 35.8\% and reduces execution time by up to 40.4\% relative to state-of-the-art methods. These results demonstrate that Branch-and-Browse is a reliable and efficient framework for LLM-based web agents.
- Abstract(参考訳): 大規模言語モデル(LLM)を利用した自律型Webエージェントは、情報検索、レポート生成、オンライントランザクションなどの目標指向タスクを実行する強力な可能性を示している。
これらのエージェントは、オープンなWeb環境における実践的具体的推論に向けた重要なステップである。
バニラ線形手法は多段階の推論で失敗し、効果的なバックトラックが欠如しているのに対して、他の探索戦略は粗粒度で計算コストがかかる。
Branch-and-Browseは、構造化推論処理、コンテキスト記憶、効率的な実行を統一する、きめ細かいWebエージェントフレームワークです。
それ
i) 木構造探索による明示的なサブタスク管理を制御可能なマルチブランチ推論に適用する。
二 背景推論による効率的なWeb状態再生によるブートストラップ探索及び
(iii) ページアクションメモリを活用して、セッション内およびセッション間で探索されたアクションを共有する。
WebArenaベンチマークでは、Branch-and-Browseはタスク成功率35.8\%に達し、最先端の手法と比較して実行時間を最大40.4\%削減する。
これらの結果から,ブランチ・アンド・ブラウズはLLMベースのWebエージェントの信頼性と効率的なフレームワークであることが示された。
関連論文リスト
- FocusAgent: Simple Yet Effective Ways of Trimming the Large Context of Web Agents [76.12500510390439]
大規模言語モデル(LLM)を利用したWebエージェントは、ユーザの目標を達成するために、長いWebページの観察を処理しなければならない。
既存のプルーニング戦略は、関連するコンテンツを捨てるか、無関係なコンテキストを保持するかのいずれかであり、最適以下の行動予測につながる。
FocusAgentは軽量LCMレトリバーを利用してアクセシビリティツリー(AxTree)観測から最も関連性の高い線を抽出するシンプルで効果的なアプローチである。
論文 参考訳(メタデータ) (2025-10-03T17:41:30Z) - Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution [48.7788770680643]
Flash-Searcherは、新しい並列エージェント推論フレームワークである。
複雑なタスクを明示的な依存関係でサブタスクに分解し、独立した推論パスの同時実行を可能にする。
BrowseCompでは67.7%の精度で、xbench-DeepSearchでは83%、エージェントの実行手順は現在のフレームワークに比べて最大35%削減されている。
論文 参考訳(メタデータ) (2025-09-29T17:39:30Z) - WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [78.55946306325914]
有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文 参考訳(メタデータ) (2025-05-26T14:03:37Z) - WebThinker: Empowering Large Reasoning Models with Deep Research Capability [109.8504165631888]
WebThinkerは、LEMがウェブを自律的に検索し、ウェブページをナビゲートし、推論プロセス中にレポートをドラフトすることを可能にするディープリサーチエージェントである。
また、Autonomous Think-Search-and-Draft戦略を採用しており、モデルが推論、情報収集、レポート作成をリアルタイムでシームレスにインターリーブすることができる。
我々のアプローチは複雑なシナリオにおけるLEMの信頼性と適用性を高め、より有能で多目的な深層研究システムへの道を開く。
論文 参考訳(メタデータ) (2025-04-30T16:25:25Z) - Tree-based Focused Web Crawling with Reinforcement Learning [3.4877567508788134]
集中型クローラは、ターゲットトピックに関連するWebページやWebサイトを可能な限り多く見つけ、無関係なものを避けることを目的としている。
我々は,関連Webページ数と関連Webサイト数の両方を最大化することを目的とした,集中型クローリングのための新しいフレームワークであるTRESを提案する。
論文 参考訳(メタデータ) (2021-12-12T00:19:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。