論文の概要: Interaction-Driven Browsing: A Human-in-the-Loop Conceptual Framework Informed by Human Web Browsing for Browser-Using Agents
- arxiv url: http://arxiv.org/abs/2509.12049v1
- Date: Mon, 15 Sep 2025 15:31:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.371455
- Title: Interaction-Driven Browsing: A Human-in-the-Loop Conceptual Framework Informed by Human Web Browsing for Browser-Using Agents
- Title(参考訳): インタラクション駆動型ブラウジング: ブラウザ利用エージェントのためのヒューマンWebブラウジングによって構築された人間- the-Loop の概念的フレームワーク
- Authors: Hyeonggeun Yun, Jinkyu Jang,
- Abstract要約: 本稿では,人間のWeb閲覧行動の理論に基づいて,ループ内のヒューマン・イン・ザ・ループの概念的枠組みを提案する。
このフレームワークは、BUAが積極的に次のアクションを提案し、ユーザがフィードバックを通じてブラウジングプロセスを運営する反復ループに重点を置いている。
- 参考スコア(独自算出の注目度): 0.6445605125467574
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Although browser-using agents (BUAs) show promise for web tasks and automation, most BUAs terminate after executing a single instruction, failing to support users' complex, nonlinear browsing with ambiguous goals, iterative decision-making, and changing contexts. We present a human-in-the-loop (HITL) conceptual framework informed by theories of human web browsing behavior. The framework centers on an iterative loop in which the BUA proactively proposes next actions and the user steers the browsing process through feedback. It also distinguishes between exploration and exploitation actions, enabling users to control the breadth and depth of their browsing. Consequently, the framework aims to reduce users' physical and cognitive effort while preserving users' traditional browsing mental model and supporting users in achieving satisfactory outcomes. We illustrate how the framework operates with hypothetical use cases and discuss the shift from manual browsing to interaction-driven browsing. We contribute a theoretically informed conceptual framework for BUAs.
- Abstract(参考訳): ブラウザ利用エージェント(BUA)はWebタスクと自動化を約束するが、ほとんどのBUAは1つの命令を実行した後で終了し、ユーザの複雑なブラウジング、曖昧な目標を持った非線形ブラウジング、反復的な意思決定、コンテキスト変更をサポートしない。
本稿では,人間のWebブラウジング行動の理論に基づいて,Human-in-the-loop(HITL)の概念的枠組みを提案する。
このフレームワークは、BUAが積極的に次のアクションを提案し、ユーザがフィードバックを通じてブラウジングプロセスを運営する反復ループに重点を置いている。
また、探索とエクスプロイトのアクションを区別し、ユーザーはブラウジングの幅と深さを制御できる。
このフレームワークは、ユーザの伝統的な閲覧精神モデルを維持しつつ、ユーザの身体的・認知的努力を減らし、満足な成果を得られるように支援することを目的としている。
このフレームワークが仮想的なユースケースでどのように機能するかを説明し、手動ブラウジングからインタラクション駆動ブラウジングへの移行について議論する。
我々は,BUAの理論的に理解された概念的枠組みに貢献する。
関連論文リスト
- Agency Among Agents: Designing with Hypertextual Friction in the Algorithmic Web [0.29465623430708904]
ハイパーテキストシステムでは,創発性,連想的思考,ユーザ主導による意味作りが重視されている。
アルゴリズムシステムではプロセスがあいまいになり,参加がフラットになる傾向がある。
論文 参考訳(メタデータ) (2025-07-31T14:18:28Z) - Orca: Browsing at Scale Through User-Driven and AI-Facilitated Orchestration Across Malleable Webpages [18.25019078938821]
プロトタイプのWebブラウザであるOrcaとの新しいインタラクションを提示する。
Orcaは、大規模にWebコンテンツの探索、運用、組織化、合成をサポートする。
評価の結果,情報収集,ユーザコントロールの強化,およびWeb上のより広い情報空間における感覚形成の柔軟性向上に対する「期待」が明らかにされた。
論文 参考訳(メタデータ) (2025-05-28T20:13:39Z) - WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [74.82886755416949]
有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文 参考訳(メタデータ) (2025-05-26T14:03:37Z) - R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory [53.94879482534949]
現在のモデルは、Web構造の可視化と理解が限られているため、効率的なナビゲーションとアクション実行に苦しむことが多い。
提案したR2D2フレームワークは,2つのパラダイムを統合することで,これらの課題に対処する。
本研究は,記憶を増強したナビゲーションと反射学習を組み合わせることで,Webエージェントの能力が向上することが示唆された。
論文 参考訳(メタデータ) (2025-01-21T20:21:58Z) - Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。
未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。
まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。
インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文 参考訳(メタデータ) (2024-12-02T08:16:38Z) - Representing Web Applications As Knowledge Graphs [0.0]
提案手法は、各ノードをアプリケーションの現在の状態の構造化された表現としてモデル化し、エッジはユーザ主導のアクションや遷移を反映する。
この構造化された表現は、Webアプリケーションのより包括的で機能的な理解を可能にし、自動テストや振る舞い分析といった下流タスクに貴重な洞察を提供する。
論文 参考訳(メタデータ) (2024-10-06T02:50:41Z) - Constraining Participation: Affordances of Feedback Features in Interfaces to Large Language Models [49.74265453289855]
大規模言語モデル(LLM)は、コンピュータ、Webブラウザ、ブラウザベースのインターフェースによるインターネット接続を持つ人なら誰でも利用できるようになった。
本稿では,ChatGPTインタフェースにおける対話型フィードバック機能の可能性について検討し,ユーザ入力の形状やイテレーションへの参加について分析する。
論文 参考訳(メタデータ) (2024-08-27T13:50:37Z) - Tell Me More! Towards Implicit User Intention Understanding of Language
Model Driven Agents [110.25679611755962]
現在の言語モデル駆動エージェントは、しばしば効果的なユーザ参加のメカニズムを欠いている。
Intention-in-Interaction (IN3) は明示的なクエリを通してユーザの暗黙の意図を検査するための新しいベンチマークである。
私たちは、タスクの曖昧さを積極的に評価し、ユーザの意図を問う強力なモデルであるMistral-Interactを経験的に訓練し、それらを実行可能な目標へと洗練させます。
論文 参考訳(メタデータ) (2024-02-14T14:36:30Z) - Think, Act, and Ask: Open-World Interactive Personalized Robot Navigation [17.279875204729553]
Zero-Shot Object Navigation (ZSON)は、エージェントが未知の環境でオープン語彙オブジェクトへナビゲートすることを可能にする。
ZIPONでは、ユーザーとの会話をしながら、ロボットがパーソナライズされた目標オブジェクトにナビゲートする必要がある。
我々は、知覚、ナビゲーション、コミュニケーションのための異なるモジュールを操作するためのシーケンシャルな決定を行うために、Open-woRld Interactive persOnalized Navigation (ORION)を提案する。
論文 参考訳(メタデータ) (2023-10-12T01:17:56Z) - Signifiers as a First-class Abstraction in Hypermedia Multi-Agent
Systems [0.6595290783361959]
我々は、Webベースのマルチエージェントシステムにおいて、シグニケータを第一級の抽象化として導入するために、Affordance TheoryとHuman-Computer Interactionの概念と方法を構築した。
我々は,情報利用の促進を目的とした,ハイパーメディア環境におけるシグニチャの文脈曝露に関する形式モデルを定義した。
論文 参考訳(メタデータ) (2023-02-14T10:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。