論文の概要: WebChain: A Large-Scale Human-Annotated Dataset of Real-World Web Interaction Traces
- arxiv url: http://arxiv.org/abs/2603.05295v1
- Date: Thu, 05 Mar 2026 15:37:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.301541
- Title: WebChain: A Large-Scale Human-Annotated Dataset of Real-World Web Interaction Traces
- Title(参考訳): WebChain: 実世界のWebインタラクショントレースの大規模人間アノテーションデータセット
- Authors: Sicheng Fan, Rui Wan, Yifei Leng, Gaoning Liang, Li Ling, Yanyi Shang, Dehan Kong,
- Abstract要約: WebChainは、現実世界のWebサイト上で、人間の注釈付きトラジェクトリの最大のオープンソースデータセットである。
私たちの仕事は、次世代のスケーラブルなWebエージェントを構築し、厳格に評価するために必要なデータと洞察を提供します。
- 参考スコア(独自算出の注目度): 5.150606279179606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce WebChain, the largest open-source dataset of human-annotated trajectories on real-world websites, designed to accelerate reproducible research in web agents. It contains 31,725 trajectories and 318k steps, featuring a core Triple Alignment of visual, structural, and action data to provide rich, multi-modal supervision. The data is collected via a scalable pipeline that ensures coverage of complex, high-value tasks often missed by synthetic methods. Leveraging this dataset, we propose a Dual Mid-Training recipe that decouples spatial grounding from planning, achieving state-of-the-art performance on our proposed WebChainBench and other public GUI benchmarks. Our work provides the data and insights necessary to build and rigorously evaluate the next generation of scalable web agents.
- Abstract(参考訳): 我々は,Webエージェントにおける再現可能な研究を加速するために,実世界のWebサイト上で,人間の注釈付きトラジェクトリの最大のオープンソースデータセットであるWebChainを紹介した。
31,725の軌道と318kのステップを含み、視覚、構造、行動データの3つの中心的なアライメントを備え、リッチでマルチモーダルな監視を提供する。
データはスケーラブルなパイプラインを通じて収集され、複雑な高価値タスクのカバレッジが合成メソッドによって失われることが保証される。
提案するWebChainBenchおよび他の公開GUIベンチマーク上で,空間的接地を計画から切り離し,最先端のパフォーマンスを達成するための2つの中間学習レシピを提案する。
私たちの仕事は、次世代のスケーラブルなWebエージェントを構築し、厳格に評価するために必要なデータと洞察を提供します。
関連論文リスト
- Scaling Web Agent Training through Automatic Data Generation and Fine-grained Evaluation [54.945281159783896]
Webエージェントのための高品質なトレーニングデータを自動的に生成するスケーラブルなパイプラインを提案する。
本稿では,タスク完了に向けた進捗のきめ細かい評価を提供する制約に基づく新しい評価フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-13T02:52:18Z) - CrediBench: Building Web-Scale Network Datasets for Information Integrity [27.562742270396086]
CrediBenchは、時間的Webグラフを構築するための大規模データ処理パイプラインである。
我々のアプローチは、一般的な誤情報領域の動的進化を捉えている。
本稿では,このグラフスナップショットを用いた実験から,信頼度を学習するための構造的およびWebページコンテンツ信号の強度を実証する。
論文 参考訳(メタデータ) (2025-09-27T14:42:48Z) - WebDS: An End-to-End Benchmark for Web-based Data Science [59.270670758607494]
WebDSは、Webベースの初のエンドツーエンドデータサイエンスベンチマークである。
29のWebサイトにわたる870のWebベースのデータサイエンスタスクで構成されている。
WebDSは、実用的に有用なLCMベースのデータサイエンスの開発において、大きな進歩の舞台となる。
論文 参考訳(メタデータ) (2025-08-02T06:39:59Z) - Empowering Bridge Digital Twins by Bridging the Data Gap with a Unified Synthesis Framework [6.238251307666132]
本稿では,3次元ブリッジデータを生成するための体系的枠組みを提案する。
コンポーネントレベルのインスタンスアノテーション、高忠実度カラー、正確な正規ベクトルを特徴とするポイントクラウドを自動的に生成できる。
実世界のブリッジセマンティックセマンティックセグメンテーションにおいて,合成データを用いてトレーニングしたPointNet++モデルにより,平均的なmIoU(Intersection over Union)が84.2%に達することを示す。
論文 参考訳(メタデータ) (2025-07-08T09:34:55Z) - AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials [53.376263056033046]
既存のアプローチは高価な人間のアノテーションに依存しており、大規模には持続不可能である。
本稿では,Webエージェントトラジェクトリを生成するスケーラブルなデータ合成パイプラインであるAgentTrekを提案する。
完全に自動化されたアプローチは、データ収集コストを大幅に削減し、人間のアノテータを使わずに、高品質な軌道を0.55ドルに抑えることができます。
論文 参考訳(メタデータ) (2024-12-12T18:59:27Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - GROWN+UP: A Graph Representation Of a Webpage Network Utilizing
Pre-training [0.2538209532048866]
我々は、Webページ構造を取り込み、大量のラベル付きデータに基づいて事前訓練を行い、Webページ上の任意のタスクに効果的に微調整できる、非依存のディープグラフニューラルネットワーク特徴抽出器を導入する。
我々は,Webページボイラプレートの除去とジャンル分類という,非常に異なる2つのベンチマークで複数のデータセットを用いて,事前学習したモデルが最先端の結果を得ることを示す。
論文 参考訳(メタデータ) (2022-08-03T13:37:27Z) - Webly Supervised Fine-Grained Recognition: Benchmark Datasets and An
Approach [115.91099791629104]
WebFG-496 と WebiNat-5089 の2つの新しいベンチマークを構築した。
WebiNat-5089には5089のサブカテゴリと1100万以上のWebトレーニングイメージが含まれている。
そこで本研究では,これらのデータセットのベンチマークを行うための新しいウェブ教師付き手法("Peer-learning'" と呼ぶ)を提案する。
論文 参考訳(メタデータ) (2021-08-05T06:28:32Z) - Where2Act: From Pixels to Actions for Articulated 3D Objects [54.19638599501286]
可動部を有する関節物体の押出しや引抜き等の基本動作に関連する高度に局所化された動作可能な情報を抽出する。
シミュレーションでネットワークをトレーニングできるオンラインデータサンプリング戦略を備えた学習から対話までのフレームワークを提案します。
私たちの学習モデルは、現実世界のデータにも転送します。
論文 参考訳(メタデータ) (2021-01-07T18:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。