論文の概要: ExpSeek: Self-Triggered Experience Seeking for Web Agents
- arxiv url: http://arxiv.org/abs/2601.08605v1
- Date: Tue, 13 Jan 2026 14:48:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.235998
- Title: ExpSeek: Self-Triggered Experience Seeking for Web Agents
- Title(参考訳): ExpSeek:Webエージェントを自力で探す
- Authors: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li,
- Abstract要約: 本稿では,段階的な積極的探索に向けて経験をシフトさせるExpSeekを提案する。
本実験は, 自己トリガー信号としてのエントロピーの実現可能性と利点を検証した。
4Bの小規模体験モデルでさえ、より大きなエージェントモデルの性能を大幅に向上させることができる。
- 参考スコア(独自算出の注目度): 55.73755116139941
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.
- Abstract(参考訳): Webエージェントに対する経験的介入は有望な技術的パラダイムとして現れ、蓄積された経験から貴重な洞察を提供することによってエージェントインタラクション能力を高める。
しかし、既存の手法は、タスク実行の前にグローバルなコンテキストとして経験を受動的に注入し、エージェントと環境の相互作用の間、動的に変化するコンテキスト観察に適応するのに苦労する。
本研究では,(1)モデル固有の信号を用いて介入タイミングを決定するためにステップレベルのエントロピー閾値を推定し,(2)ステップレベルのテータ設計された体験コンテンツを設計するExpSeekを提案する。
Qwen3-8Bと32Bの4つの挑戦的なWebエージェントベンチマークの実験では、ExpSeekはそれぞれ9.3%と7.5%の絶対的な改善を達成している。
実験により, 自己トリガー信号としてのエントロピーの実現可能性と利点を検証した結果, 4B の小型体験モデルであっても, より大きなエージェントモデルの性能を著しく向上させることができることがわかった。
関連論文リスト
- MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling [115.74855199827596]
MiroThinkerは、ツール拡張推論と情報検索機能を向上させるために設計されたオープンソースの研究エージェントである。
モデルサイズやコンテキスト長のみをスケールアップする以前のエージェントとは異なり、MiroThinker氏はモデルレベルでのインタラクションスケーリングについて検討している。
論文 参考訳(メタデータ) (2025-11-14T18:52:07Z) - Agent Learning via Early Experience [93.83579011718858]
言語エージェントの長期的な目標は、彼ら自身の経験から学び、改善することであり、最終的には複雑な現実世界のタスクにおいて人間より優れています。
現在のエージェントのほとんどは、専門家データによる教師付き微調整に依存しており、スケールと一般化が不十分である。
本研究では,(1)環境力学における政策の基盤として収集された状態を利用するインプリシット・ワールド・モデリング,(2)エージェントが最適な行動から学習し,推論と意思決定を改善するための自己回帰という2つの手法について検討する。
論文 参考訳(メタデータ) (2025-10-09T17:59:17Z) - Attribution for Enhanced Explanation with Transferable Adversarial eXploration [10.802449518516209]
AttEXplore++は、転送可能な逆アタックメソッドを組み込むことで、属性を向上させる。
我々は、ImageNetデータセットを用いて、CNN(Inception-v3, ResNet-50, VGG16, vision transformer)を含む5つのモデルで実験を行う。
提案手法は,AttEXploreに比べて7.57%,32.62%の性能向上を実現している。
論文 参考訳(メタデータ) (2024-12-27T08:27:53Z) - Iterative Experience Refinement of Software-Developing Agents [81.09737243969758]
大規模な言語モデル(LLM)は、過去の経験を活用してエラーを低減し、効率を高めることができる。
本稿では,LLMエージェントがタスク実行中に反復的に経験を洗練できる反復体験精錬フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T11:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。