論文の概要: Adapting Web Agents with Synthetic Supervision
- arxiv url: http://arxiv.org/abs/2511.06101v1
- Date: Sat, 08 Nov 2025 18:45:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.755972
- Title: Adapting Web Agents with Synthetic Supervision
- Title(参考訳): シンセティック・スーパービジョンによるWebエージェントの適応
- Authors: Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao,
- Abstract要約: Webエージェントは、環境固有のタスクやデモが不足しているため、新しいWebサイトへの適応に苦慮している。
最近の研究は、この課題に対処するために合成データ生成を探求している。
完全合成監視フレームワークであるSynthAgentを提案する。
- 参考スコア(独自算出の注目度): 80.89365133130558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Web agents struggle to adapt to new websites due to the scarcity of environment specific tasks and demonstrations. Recent works have explored synthetic data generation to address this challenge, however, they suffer from data quality issues where synthesized tasks contain hallucinations that cannot be executed, and collected trajectories are noisy with redundant or misaligned actions. In this paper, we propose SynthAgent, a fully synthetic supervision framework that aims at improving synthetic data quality via dual refinement of both tasks and trajectories. Our approach begins by synthesizing diverse tasks through categorized exploration of web elements, ensuring efficient coverage of the target environment. During trajectory collection, we refine tasks when conflicts with actual observations are detected, mitigating hallucinations while maintaining task consistency. After collection, we conduct trajectory refinement with a global context to mitigate potential noise or misalignments. Finally, we fine-tune open-source web agents on the refined synthetic data to adapt them to the target environment. Experimental results demonstrate that SynthAgent outperforms existing synthetic data methods, validating the importance of high-quality synthetic supervision. The code will be publicly available at https://github.com/aiming-lab/SynthAgent.
- Abstract(参考訳): Webエージェントは、環境固有のタスクやデモが不足しているため、新しいWebサイトへの適応に苦慮している。
近年の研究では、この課題に対処するために、合成されたデータ生成を探索しているが、合成されたタスクが実行できない幻覚を含むデータ品質の問題に悩まされており、収集されたトラジェクトリは冗長あるいは不整合な動作でうるさい。
本稿では,タスクとトラジェクトリの二重改良による合成データ品質の向上を目的とした,完全合成監視フレームワークであるSynthAgentを提案する。
我々のアプローチは、Web要素の分類された探索を通じて多様なタスクを合成し、ターゲット環境の効率的なカバレッジを確保することから始まります。
軌跡収集では,実際の観測結果との矛盾が検出された場合にタスクを洗練し,タスクの一貫性を維持しながら幻覚を緩和する。
収集後,潜在的なノイズや誤認識を軽減するため,グローバルな文脈で軌道修正を行う。
最後に,改良された合成データに基づいてオープンソースWebエージェントを微調整し,ターゲット環境に適応させる。
実験により,SynthAgentは既存の合成データ手法よりも優れており,高品質な合成管理の重要性が検証された。
コードはhttps://github.com/aiming-lab/SynthAgent.comで公開される。
関連論文リスト
- Synthesizing Agentic Data for Web Agents with Progressive Difficulty Enhancement Mechanisms [81.90219895125178]
Webベースの「ディープリサーチ」エージェントは、オンラインツールとの長時間のインタラクションを通じてタスクに答える、複雑な問題の解決を目指している。
基礎となる言語モデルは、長い水平推論に最適化されないことが多いため、これらのタスクは依然として困難なままである。
複雑化を徐々に進めることで、疑問-答えのペアを生成する2段階のデータ合成パイプラインを導入する。
論文 参考訳(メタデータ) (2025-10-15T06:34:46Z) - Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。
合成データがモデル一般化をどのように改善するかを批判的に検討する。
本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-09-07T19:28:52Z) - SynSpill: Improved Industrial Spill Detection With Synthetic Data [3.297182592932918]
大規模ビジョンランゲージモデル(VLM)は、強力なゼロショット機能を通じて汎用的な視覚認識を変換している。
その性能は、産業の流出検知のようなニッチで安全に重要な領域で著しく低下する。
高品質な合成データ生成パイプラインを中心としたスケーラブルなフレームワークを導入する。
論文 参考訳(メタデータ) (2025-08-13T20:09:58Z) - WebSynthesis: World-Model-Guided MCTS for Efficient WebUI-Trajectory Synthesis [34.998277998052444]
本稿では,軌道合成と学習のための新しいフレームワークであるWebSynthesisを提案する。
本稿では,WebSynthesis を用いて訓練したエージェントが,大規模実世界のデータに対してトレーニングしたモデルに匹敵する,あるいはそれ以上の性能を達成することを示す。
論文 参考訳(メタデータ) (2025-07-06T12:31:10Z) - OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis [55.390060529534644]
グラフィカルユーザインタフェース(GUI)エージェントのための新しいデータ合成パイプラインであるOS-Genesisを提案する。
事前に定義されたタスクに頼る代わりに、OS-Genesisはエージェントがまず環境を認識し、ステップワイドなインタラクションを実行することを可能にする。
我々は,OS-Genesisを用いたGUIエージェントのトレーニングにより,高度に挑戦するオンラインベンチマークの性能が大幅に向上することが実証された。
論文 参考訳(メタデータ) (2024-12-27T16:21:58Z) - SyntheWorld: A Large-Scale Synthetic Dataset for Land Cover Mapping and
Building Change Detection [20.985372561774415]
我々は、品質、多様性、スケールに比類しない合成データセットであるSyntheWorldを提示する。
サブメーターレベルのピクセルを持つ4万枚の画像と8つのカテゴリの詳細なランドカバーアノテーションを含んでいる。
リモートセンシング画像処理研究を容易にするためのSyntheWorldをリリースする。
論文 参考訳(メタデータ) (2023-09-05T02:42:41Z) - Domain Adaptation of Synthetic Driving Datasets for Real-World
Autonomous Driving [0.11470070927586014]
特定のコンピュータビジョンタスクのための合成データで訓練されたネットワークは、実世界のデータでテストすると大幅に劣化する。
本稿では,このような手法を改良するための新しい手法を提案し,評価する。
本稿では,このペア選択にセマンティック・インスペクションを効果的に組み込む手法を提案し,モデルの性能向上に寄与する。
論文 参考訳(メタデータ) (2023-02-08T15:51:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。