論文の概要: Reflection-Based Memory For Web navigation Agents
- arxiv url: http://arxiv.org/abs/2506.02158v1
- Date: Mon, 02 Jun 2025 18:39:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.974951
- Title: Reflection-Based Memory For Web navigation Agents
- Title(参考訳): Webナビゲーションエージェントのためのリフレクションベースメモリ
- Authors: Ruhana Azam, Aditya Vempaty, Ashish Jagmohan,
- Abstract要約: リフレクション・アジュメンテーション・プランニング(Respection-Augment Planning, ReAP)は, 自己回帰を用いて過去の成功と失敗の両方を活用できるウェブナビゲーションシステムである。
提案手法は, これまでに失敗したタスクに対して, 11ポイント, 29ポイントのベースライン結果を改善する。
- 参考スコア(独自算出の注目度): 0.6383640665055312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Web navigation agents have made significant progress, yet current systems operate with no memory of past experiences -- leading to repeated mistakes and an inability to learn from previous interactions. We introduce Reflection-Augment Planning (ReAP), a web navigation system to leverage both successful and failed past experiences using self-reflections. Our method improves baseline results by 11 points overall and 29 points on previously failed tasks. These findings demonstrate that reflections can transfer to different web navigation tasks.
- Abstract(参考訳): Webナビゲーションエージェントは大きな進歩を遂げているが、現在のシステムは過去の経験を記憶せずに運用されている。
リフレクション・アジュメンテーション・プランニング(Respection-Augment Planning, ReAP)は, 自己回帰を用いて過去の成功と失敗の両方を活用できるウェブナビゲーションシステムである。
提案手法は, これまでに失敗したタスクに対して, 11ポイント, 29ポイントのベースライン結果を改善する。
これらの結果は、リフレクションが異なるWebナビゲーションタスクに転送可能であることを示している。
関連論文リスト
- WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [74.82886755416949]
有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文 参考訳(メタデータ) (2025-05-26T14:03:37Z) - Enhancing Web Agents with Explicit Rollback Mechanisms [55.276852838877346]
我々は、明示的なロールバック機構でWebエージェントを強化し、エージェントがナビゲーションの軌跡の前の状態に戻れるようにした。
このメカニズムは、モデルに検索プロセスを直接制御する柔軟性を与え、効果的で効率的なWebナビゲーション方法をもたらす。
論文 参考訳(メタデータ) (2025-04-16T05:41:20Z) - Applying Deep Learning to Ads Conversion Prediction in Last Mile Delivery Marketplace [4.37103775374109]
ディープニューラルネットワーク(DNN)は、Webスケールのランキングシステムに革命をもたらし、複雑なユーザの振る舞いを捉え、パフォーマンスを向上するブレークスルーを可能にした。
DoorDashでは、ホームページ広告ランキングシステムを従来のツリーベースモデルから最先端のマルチタスクDNNに移行することで、この変革的なパワーを活用しました。
論文 参考訳(メタデータ) (2025-02-14T19:23:20Z) - R2D2: Remembering, Reflecting and Dynamic Decision Making for Web Agents [53.94879482534949]
現在のモデルは、Web構造の可視化と理解が限られているため、効率的なナビゲーションとアクション実行に苦しむことが多い。
提案したR2D2フレームワークは,2つのパラダイムを統合することで,これらの課題に対処する。
本研究は,記憶を増強したナビゲーションと反射学習を組み合わせることで,Webエージェントの能力が向上することが示唆された。
論文 参考訳(メタデータ) (2025-01-21T20:21:58Z) - Virtual Guidance as a Mid-level Representation for Navigation with Augmented Reality [7.873411316161205]
視覚的でない命令信号を視覚的に表現する「仮想誘導」技術を紹介する。
これらの視覚的手がかりは、エージェントのカメラビューにオーバーレイされ、分かりやすいナビゲーション誘導信号として機能する。
論文 参考訳(メタデータ) (2023-03-05T17:55:15Z) - Offline Reinforcement Learning for Visual Navigation [66.88830049694457]
ReViNDは、ロボットナビゲーションのための最初のオフラインRLシステムで、これまで収集されたデータを利用して、現実世界でユーザーが指定した報酬関数を最適化する。
ReViNDは、このデータセットからのオフライントレーニングのみを使用して、遠方の目標にナビゲートできることを示し、ユーザ指定の報酬関数に基づいて、質的に異なる振る舞いを示す。
論文 参考訳(メタデータ) (2022-12-16T02:23:50Z) - Explore before Moving: A Feasible Path Estimation and Memory Recalling
Framework for Embodied Navigation [117.26891277593205]
ナビゲーションに焦点をあて,経験や常識に欠ける既存のナビゲーションアルゴリズムの問題を解決する。
移動前に2回思考する能力に触発されて、不慣れな場面で目標を追求する実現可能な経路を考案し、パス推定とメモリリコールフレームワークと呼ばれる経路計画手法を提案する。
EmbodiedQAナビゲーションタスクにおけるPEMRの強力な実験結果を示す。
論文 参考訳(メタデータ) (2021-10-16T13:30:55Z) - Augmented reality navigation system for visual prosthesis [67.09251544230744]
反応ナビゲーションと経路計画のソフトウェアを組み込んだ視覚補綴用拡張現実ナビゲーションシステムを提案する。
対象を地図上に配置し、対象の軌道を計画し、対象に示し、障害なく再計画する。
その結果,目標を達成するための時間と距離を減らし,障害物衝突の回数を大幅に減らし,航法性能の向上を図っている。
論文 参考訳(メタデータ) (2021-09-30T09:41:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。