論文の概要: Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction
- arxiv url: http://arxiv.org/abs/2604.27221v1
- Date: Wed, 29 Apr 2026 21:43:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.815566
- Title: Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction
- Title(参考訳): Web2BigTable:インターネット規模の情報検索と抽出のための双方向マルチエージェントLLMシステム
- Authors: Yuxuan Huang, Yihang Chen, Zhiyuan He, Yuxiang Chen, Ka Yiu Lee, Huichi Zhou, Weilin Luo, Meng Fang, Jun Wang,
- Abstract要約: textbfWeb2BigTableはWebツーテーブル検索のためのマルチエージェントフレームワークである。
Web2BigTableは、WideSearchの新たな最先端をセットし、Avg@4 Success Rate of textbf38.50$7.5times$ second at 5.10、Row F1 of textbf63.53 (+25.03 over second best)、Item F1 of textbf80.12 (+14.42 over second best)に到達した。
また、XBench の深度指向探索にも一般化する。
- 参考スコア(独自算出の注目度): 38.55682016152131
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic web search increasingly faces two distinct demands: deep reasoning over a single target, and structured aggregation across many entities and heterogeneous sources. Current systems struggle on both fronts. Breadth-oriented tasks demand schema-aligned outputs with wide coverage and cross-entity consistency, while depth-oriented tasks require coherent reasoning over long, branching search trajectories. We introduce \textbf{Web2BigTable}, a multi-agent framework for web-to-table search that supports both regimes. Web2BigTable adopts a bi-level architecture in which an upper-level orchestrator decomposes the task into sub-problems and lower-level worker agents solve them in parallel. Through a closed-loop run--verify--reflect process, the framework jointly improves decomposition and execution over time via persistent, human-readable external memory, with self-evolving updates to each single-agent. During execution, workers coordinate through a shared workspace that makes partial findings visible, allowing them to reduce redundant exploration, reconcile conflicting evidence, and adapt to emerging coverage gaps. Web2BigTable sets a new state of the art on WideSearch, reaching an Avg@4 Success Rate of \textbf{38.50} ($7.5\times$ the second best at 5.10), Row F1 of \textbf{63.53} (+25.03 over the second best), and Item F1 of \textbf{80.12} (+14.42 over the second best). It also generalises to depth-oriented search on XBench-DeepSearch, achieving 73.0 accuracy. Code is available at https://github.com/web2bigtable/web2bigtable.
- Abstract(参考訳): エージェントWeb検索は、単一のターゲットに対する深い推論と、多くのエンティティと異種ソースにまたがる構造化された集約という、2つの異なる要求に直面している。
現在のシステムは両面で苦戦している。
ブレッドス指向タスクは、広範囲のカバレッジと相互整合性を備えたスキーマ整合出力を要求する一方、深度指向タスクは、長い分岐した探索軌跡に対するコヒーレントな推論を必要とする。
本稿では,Web-to-table 検索のためのマルチエージェントフレームワークである \textbf{Web2BigTable} について紹介する。
Web2BigTableは、上位レベルのオーケストレータがタスクをサブプロブレムに分解し、下位レベルのワーカエージェントがそれらを並列に解決する、双方向アーキテクチャを採用している。
クローズドループのrun-verify--reflectプロセスを通じて、このフレームワークは、永続的でヒューマン可読な外部メモリを通じて、分解と実行を共同で改善する。
実行中、作業者は共有ワークスペースを通して部分的な発見を可視化し、冗長な探索を減らし、矛盾する証拠を調整し、新たなカバレッジギャップに適応できるように調整する。
Web2BigTableは、WideSearchに新しい最先端技術を設定し、Avg@4 Success Rate of \textbf{38.50} (7.5\times$ second best at 5.10), Row F1 of \textbf{63.53} (+25.03 over the second best), Item F1 of \textbf{80.12} (+14.42 over the second best)に到達した。
また、XBench-DeepSearchの深さ指向検索にも一般化され、73.0精度が達成されている。
コードはhttps://github.com/web2bigtable/web2bigtableで入手できる。
関連論文リスト
- InfoSeeker: A Scalable Hierarchical Parallel Agent Framework for Web Information Seeking [39.22757710468795]
ほぼ分解可能性の原理に基づく階層型フレームワークであるフレームワークを,戦略的textitHost,複数textitManagers,並列textitWorkersを含む。
マネージャ層でのアグリゲーションとリフレクションのメカニズムを活用することで、我々のフレームワークは飽和やエラーの伝播を防ぐために厳密なコンテキスト分離を実行します。
2つの補完ベンチマークによる評価は、効率(3~5倍のスピードアップ)と有効性の両方を示し、WideSearch-enで8.4%、BrowseComp-zhで52.9%の精度を達成した。
論文 参考訳(メタデータ) (2026-04-03T11:19:17Z) - A-MapReduce: Executing Wide Search via Agentic MapReduce [29.20827525190302]
A-MapReduceはパラダイムにインスパイアされたマルチエージェント実行フレームワークである。
ワイドサーチを水平構造検索問題として再放送する。
A-MapReduceはハイパフォーマンスで、最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2026-02-01T16:53:29Z) - Beyond Monolithic Architectures: A Multi-Agent Search and Knowledge Optimization Framework for Agentic Search [56.78490647843876]
エージェント検索は、大規模言語モデル(LLM)が推論とツールの使用をインターリーブできるようにすることによって、複雑な情報を探すための有望なパラダイムとして登場した。
本稿では,bfM-ASKを提案する。bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK。
論文 参考訳(メタデータ) (2026-01-08T08:13:27Z) - Towards Hyper-Efficient RAG Systems in VecDBs: Distributed Parallel Multi-Resolution Vector Search [5.216774377033164]
我々は,VecDBにおけるRAGのための新しい多分解能ベクトルインデックスフレームワークである textbfSemantic Pyramid Indexing (SPI) を提案する。
オフラインチューニングやモデルトレーニングの分離を必要とする既存の階層的手法とは異なり、SPIはドキュメントの埋め込みの上にセマンティックピラミッドを構築し、クエリ毎に最適な解像度レベルを動的に選択する。
FAISSとQdrantバックエンドのプラグインとしてSPIを実装し、MS MARCO、Natural Questions、マルチモーダル検索ベンチマークを含む複数のRAGタスクでSPIを評価する。
論文 参考訳(メタデータ) (2025-11-12T09:31:08Z) - UltraHorizon: Benchmarking Agent Capabilities in Ultra Long-Horizon Scenarios [63.67884284105684]
textbfUltraHorizonは、複雑な現実世界の課題に不可欠な基礎的能力を測定する新しいベンチマークである。
エージェントは、隠されたルールを反復的に発見しなければならない、長期にわたる発見タスクで設計されている。
実験の結果, LLM-agents はこれらの設定において常に不利な成績を示し, ヒトは高いスコアを得ることができた。
論文 参考訳(メタデータ) (2025-09-26T02:04:00Z) - Open Data Synthesis For Deep Research [17.22470203913576]
我々は、階層的制約満足度問題として検証可能な回答でDeep Researchタスクを定式化する。
既存のベンチマーク(Natural Questions、HotpotQAなど)は、この複雑さを捉えていない。
スケーラブルでスケーラブルな複雑なDeep ResearchタスクであるInfoSeekを紹介します。
論文 参考訳(メタデータ) (2025-08-30T06:02:56Z) - ManuSearch: Democratizing Deep Search in Large Language Models with a Transparent and Open Multi-Agent Framework [73.91207117772291]
ManuSearchは,大規模言語モデル(LLM)の深層検索を民主化するために設計された,透明でモジュール化されたマルチエージェントフレームワークである。
ManuSearchは検索と推論のプロセスを,(1)サブクエリを反復的に定式化するソリューション計画エージェント,(2)リアルタイムWeb検索を通じて関連文書を検索するインターネット検索エージェント,(3)生のWebコンテンツから重要な証拠を抽出する構造化Webページ読取エージェントの3つに分解する。
論文 参考訳(メタデータ) (2025-05-23T17:02:02Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - AutoPose: Searching Multi-Scale Branch Aggregation for Pose Estimation [96.29533512606078]
本稿では,新しいニューラルアーキテクチャサーチ(NAS)フレームワークであるAutoPoseを紹介する。
高精度で高解像度な2次元ポーズ推定に向けて、クロススケール接続の複数の並列ブランチを自動的に検出することができる。
論文 参考訳(メタデータ) (2020-08-16T22:27:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。