論文の概要: AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines
- arxiv url: http://arxiv.org/abs/2602.14296v1
- Date: Sun, 15 Feb 2026 20:03:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:49.942179
- Title: AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines
- Title(参考訳): AutoWebWorld: 有限状態マシンによる無限の検証可能なWeb環境の合成
- Authors: Yifan Wu, Yiran Peng, Yiyu Chen, Jianhao Ruan, Zijie Zhuang, Cheng Yang, Jiayi Zhang, Man Chen, Yenchi Tseng, Zhaoyang Yu, Liang Chen, Yuyao Zhai, Bang Liu, Chenglin Wu, Yuyu Luo,
- Abstract要約: AutoWebWorldは、制御可能で検証可能なWeb環境を合成するためのフレームワークである。
状態遷移が暗黙的な実際のWebサイトとは異なり、AutoWebWorldは、すべての状態、アクション、遷移ルールを明示的に定義している。
29の多様なWeb環境から11,663以上の認証トラジェクトリを生成し、1トラジェクトリあたり0.04ドルである。
- 参考スコア(独自算出の注目度): 43.251303612671194
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The performance of autonomous Web GUI agents heavily relies on the quality and quantity of their training data. However, a fundamental bottleneck persists: collecting interaction trajectories from real-world websites is expensive and difficult to verify. The underlying state transitions are hidden, leading to reliance on inconsistent and costly external verifiers to evaluate step-level correctness. To address this, we propose AutoWebWorld, a novel framework for synthesizing controllable and verifiable web environments by modeling them as Finite State Machines (FSMs) and use coding agents to translate FSMs into interactive websites. Unlike real websites, where state transitions are implicit, AutoWebWorld explicitly defines all states, actions, and transition rules. This enables programmatic verification: action correctness is checked against predefined rules, and task success is confirmed by reaching a goal state in the FSM graph. AutoWebWorld enables a fully automated search-and-verify pipeline, generating over 11,663 verified trajectories from 29 diverse web environments at only $0.04 per trajectory. Training on this synthetic data significantly boosts real-world performance. Our 7B Web GUI agent outperforms all baselines within 15 steps on WebVoyager. Furthermore, we observe a clear scaling law: as the synthetic data volume increases, performance on WebVoyager and Online-Mind2Web consistently improves.
- Abstract(参考訳): 自律型Web GUIエージェントの性能は、トレーニングデータの質と量に大きく依存している。
しかし、基本的なボトルネックが持続する: 現実世界のウェブサイトからインタラクションの軌跡を収集することは高価で、検証が難しい。
基礎となる状態遷移は隠蔽され、ステップレベルの正確性を評価するために不整合でコストのかかる外部検証に依存する。
そこで我々は,制御可能で検証可能なWeb環境をFSM(Finite State Machines)としてモデル化し,FSMをインタラクティブなWebサイトに翻訳するためのコーディングエージェントを使用することで,新しいフレームワークであるAutoWebWorldを提案する。
状態遷移が暗黙的な実際のWebサイトとは異なり、AutoWebWorldは、すべての状態、アクション、遷移ルールを明示的に定義している。
これによりプログラムによる検証が可能となり、事前定義されたルールに対してアクションの正当性を確認し、FSMグラフの目標状態に到達することでタスク成功を確認する。
AutoWebWorldでは,29のさまざまなWeb環境から11,663以上の確認済みトラジェクトリを,1トラジェクトリあたり0.04ドルで生成する,完全な自動検索/検証パイプラインが実現されている。
この合成データのトレーニングは、現実世界のパフォーマンスを大幅に向上させる。
当社の7B Web GUIエージェントは、WebVoyagerの15ステップですべてのベースラインを上回ります。
さらに、合成データ量が増加するにつれて、WebVoyagerとOnline-Mind2Webのパフォーマンスは一貫して向上する。
関連論文リスト
- WebWorld: A Large-Scale World Model for Web Agent Training [59.59257499344279]
大規模にトレーニングされた最初のオープンウェブシミュレータである textbfWebWorld シリーズを紹介する。
WebWorldは1M以上のオープンWebインタラクションをトレーニングし、推論、マルチフォーマットデータ、30以上のステップのロングホライゾンシミュレーションをサポートする。
WebWorld合成トラジェクトリでトレーニングされたQwen3-14Bは,WebArenaで+9.2%向上し,GPT-4oに匹敵する性能を示した。
論文 参考訳(メタデータ) (2026-02-16T13:06:49Z) - Web World Models [60.208836336654315]
Web World Model (WWM) は「世界状態と物理」が通常のWebコードで実装される中核となる。
リアルなウェブスタック上にWWMのスイートを構築し、現実の地理や架空の銀河探検家、ウェブスケールの百科事典や物語の世界、シミュレーションやゲームのような環境を基盤とする無限の旅行アトラスを構築します。
この結果から,ウェブスタック自体が世界モデルのスケーラブルな基盤として機能し,制御可能かつオープンな環境を実現することが示唆された。
論文 参考訳(メタデータ) (2025-12-29T18:31:45Z) - WebRenderBench: Enhancing Web Interface Generation through Layout-Style Consistency and Reinforcement Learning [24.178675410636135]
実世界のポータルサイトから収集した45.1kのWebページの大規模なベンチマークを示す。
また、最終レンダリングページからレイアウトとスタイルの整合性を測定する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2025-10-05T08:47:39Z) - Redefining Website Fingerprinting Attacks With Multiagent LLMs [2.7117643001081437]
Webサイトフィンガープリント(WFP)は、ディープラーニングモデルを使用して、暗号化されたネットワークトラフィックを分類し、訪問したWebサイトを推論する。
本研究は,利用者が同一ウェブサイト上でも非常に多様な行動を示し,個人間で異なる交通パターンを生じさせることを示す。
論文 参考訳(メタデータ) (2025-09-15T21:17:04Z) - NetGent: Agent-Based Automation of Network Application Workflows [10.829519766490014]
我々は、複雑なアプリケーションを自動化し、リアルなネットワークトラフィックデータセットを生成するためのAIエージェントフレームワークであるNetGentを紹介する。
実験では、NetGentはビデオオンデマンドストリーミング、ライブビデオストリーミング、ビデオ会議、ソーシャルメディア、ウェブスクレイピングにまたがる50以上のインターフェースを自動化した。
論文 参考訳(メタデータ) (2025-08-30T22:47:15Z) - WebSynthesis: World-Model-Guided MCTS for Efficient WebUI-Trajectory Synthesis [34.998277998052444]
本稿では,軌道合成と学習のための新しいフレームワークであるWebSynthesisを提案する。
本稿では,WebSynthesis を用いて訓練したエージェントが,大規模実世界のデータに対してトレーニングしたモデルに匹敵する,あるいはそれ以上の性能を達成することを示す。
論文 参考訳(メタデータ) (2025-07-06T12:31:10Z) - REAL: Benchmarking Autonomous Agents on Deterministic Simulations of Real Websites [9.58858258192147]
実世界のWebサイトの決定論的シミュレーションにおけるマルチターンエージェント評価のためのベンチマークおよびフレームワークであるREALを紹介する。
また、日々の複雑なユーザインタラクションを反映した112の実践的なタスクからなるベンチマークもリリースしています。
我々のフレームワークは、新しいタスクの容易な統合、再現可能な評価、スケーラブルな後学習データ生成をサポートします。
論文 参考訳(メタデータ) (2025-04-15T18:22:55Z) - AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials [53.376263056033046]
既存のアプローチは高価な人間のアノテーションに依存しており、大規模には持続不可能である。
本稿では,Webエージェントトラジェクトリを生成するスケーラブルなデータ合成パイプラインであるAgentTrekを提案する。
完全に自動化されたアプローチは、データ収集コストを大幅に削減し、人間のアノテータを使わずに、高品質な軌道を0.55ドルに抑えることができます。
論文 参考訳(メタデータ) (2024-12-12T18:59:27Z) - WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models [65.18602126334716]
既存のWebエージェントは1つの入力モダリティしか処理せず、単純化されたWebシミュレータや静的なWebスナップショットでのみ評価される。
我々は,WebVoyagerを紹介した。LMM(Large Multimodal Model)を利用したWebエージェントで,現実世界のWebサイトと対話することで,エンド・ツー・エンドでのユーザ指示を完了することができる。
GPT-4(All Tools)とWebVoyager(text-only)の両方のパフォーマンスを大幅に上回る、59.1%のタスク成功率を実現していることを示す。
論文 参考訳(メタデータ) (2024-01-25T03:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。