論文の概要: Web Verbs: Typed Abstractions for Reliable Task Composition on the Agentic Web
- arxiv url: http://arxiv.org/abs/2602.17245v1
- Date: Thu, 19 Feb 2026 10:50:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.922501
- Title: Web Verbs: Typed Abstractions for Reliable Task Composition on the Agentic Web
- Title(参考訳): Web動詞:エージェントWeb上の信頼性の高いタスク構成のための型付き抽象化
- Authors: Linxi Jiang, Rui Xi, Zhijie Liu, Shuo Chen, Zhiqiang Lin, Suman Nath,
- Abstract要約: 現在のWebエージェントは、クリックやキーストロークのような低レベルのプリミティブで動作する。
エージェントWebはWebアクションのセマンティックレイヤも必要としています。
我々は、型付き、意味的に文書化された関数のWebスケールセットである textbfWeb Verbs を提案する。
- 参考スコア(独自算出の注目度): 17.537750923987762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Web is evolving from a medium that humans browse to an environment where software agents act on behalf of users. Advances in large language models (LLMs) make natural language a practical interface for goal-directed tasks, yet most current web agents operate on low-level primitives such as clicks and keystrokes. These operations are brittle, inefficient, and difficult to verify. Complementing content-oriented efforts such as NLWeb's semantic layer for retrieval, we argue that the agentic web also requires a semantic layer for web actions. We propose \textbf{Web Verbs}, a web-scale set of typed, semantically documented functions that expose site capabilities through a uniform interface, whether implemented through APIs or robust client-side workflows. These verbs serve as stable and composable units that agents can discover, select, and synthesize into concise programs. This abstraction unifies API-based and browser-based paradigms, enabling LLMs to synthesize reliable and auditable workflows with explicit control and data flow. Verbs can carry preconditions, postconditions, policy tags, and logging support, which improves \textbf{reliability} by providing stable interfaces, \textbf{efficiency} by reducing dozens of steps into a few function calls, and \textbf{verifiability} through typed contracts and checkable traces. We present our vision, a proof-of-concept implementation, and representative case studies that demonstrate concise and robust execution compared to existing agents. Finally, we outline a roadmap for standardization to make verbs deployable and trustworthy at web scale.
- Abstract(参考訳): ウェブは、人間が閲覧する媒体から、ソフトウェアエージェントがユーザーに代わって行動する環境へと進化している。
大規模言語モデル(LLM)の進歩は、自然言語を目標指向タスクの実用的なインターフェースにするが、現在のWebエージェントのほとんどは、クリックやキーストロークのような低レベルのプリミティブで動作する。
これらの操作は脆く、非効率で、検証が難しい。
NLWebのセマンティック・レイヤのようなコンテンツ指向の取り組みを補完するため、エージェント・ウェブはWebアクションのセマンティック・レイヤも必要としています。
私たちは、APIや堅牢なクライアントサイドワークフローによって実装されるかに関わらず、一様インターフェースを介してサイト機能を公開する、型付きセマンティックな関数のWebスケールセットである‘textbf{Web Verbs}’を提案する。
これらの動詞は、エージェントが簡潔なプログラムを発見し、選択し、合成できる安定で構成可能な単位として機能する。
この抽象化はAPIベースのパラダイムとブラウザベースのパラダイムを統一することで,信頼性と監査性を備えたワークフローを明示的なコントロールとデータフローで合成することを可能にする。
Verbsには事前条件、条件、ポリシータグ、ロギングサポートがあり、安定なインターフェースを提供することで \textbf{reliability}、数十のステップをいくつかの関数呼び出しに還元することで \textbf{efficiency}、型付きコントラクトとチェック可能なトレースを通じて \textbf{verifiability} が提供される。
本稿では,既存のエージェントと比較して簡潔で堅牢な実行を実証する,概念実証実装,ケーススタディを提示する。
最後に、Webスケールで動詞をデプロイ可能で信頼性の高いものにするための標準化のロードマップを概説する。
関連論文リスト
- EmbeWebAgent: Embedding Web Agents into Any Customized UI [3.034887612600091]
EmbeWebAgentはエージェントを直接既存のUIに埋め込むフレームワークです。
プリミティブからハイレベルコンポジットまで、混合粒度作用をサポートする。
私たちのデモでは、ライブUI設定で最小限の再適合と堅牢なマルチステップ動作を示しています。
論文 参考訳(メタデータ) (2026-02-16T15:59:56Z) - Nested Browser-Use Learning for Agentic Information Seeking [60.775556172513014]
情報検索(IS)エージェントは広範囲にわたる検索タスクで高いパフォーマンスを達成しているが、ツールの使用はAPIレベルのスニペット検索やURLベースのページフェッチに限られている。
我々はNested Browser-Use Learning (NestBrowse)を提案する。NestBrowseは、ネストされた構造を通してページ探索からインタラクション制御を分離する最小かつ完全なブラウザアクションフレームワークである。
論文 参考訳(メタデータ) (2025-12-29T17:59:14Z) - Building the Web for Agents: A Declarative Framework for Agent-Web Interaction [0.7116403133334644]
我々は、WebサイトがAIエージェントの信頼性、監査可能、プライバシ保護機能を公開できるWebネイティブフレームワークVOIXを紹介した。
VOIXはツール>とコンテキスト>タグを導入し、開発者は利用可能なアクションと関連する状態を明確に定義できる。
16人の開発者を対象とした3日間のハッカソン研究で,本フレームワークの実用性,学習性,表現性を評価した。
論文 参考訳(メタデータ) (2025-11-14T13:23:34Z) - Affordance Representation and Recognition for Autonomous Agents [64.39018305018904]
本稿では,構造化データを用いた世界モデリングのためのパターン言語を提案する。
DOMトランスダクションパターンは、Webページの複雑さの課題に対処する。
Hypermedia Affordances Recognition Patternは、エージェントがその世界モデルを動的に強化することを可能にする。
論文 参考訳(メタデータ) (2025-10-28T14:27:28Z) - WALT: Web Agents that Learn Tools [66.73502484310121]
WALTは、Webサイト機能を再利用不能なツールにリバースエンジニアリングするフレームワークである。
WALTはアドホックなスキルを仮説化するのではなく、既にウェブサイトに設計されている自動化の堅牢な実装を公開している。
VisualWebArenaとWebArenaでは、WALTはより少ないステップとLLM依存の推論でより高い成功を達成している。
論文 参考訳(メタデータ) (2025-10-01T23:41:47Z) - Beyond Syntax: Action Semantics Learning for App Agents [60.56331102288794]
アクションセマンティックス学習(ASL、Action Semantics Learning)は、学習目的が真理行動の意味を捉える学習フレームワークである。
ASLは既存のメソッドよりもApp Agentの精度と一般化を大幅に改善する。
論文 参考訳(メタデータ) (2025-06-21T12:08:19Z) - WebNav: An Intelligent Agent for Voice-Controlled Web Navigation [0.0]
WebNavはマルチモーダルなWebナビゲーションのための新しいエージェントである。
システムは、スクリーンショットからの視覚ベースのコンテキストと動的DOMラベルのブラウザ拡張を組み合わせる。
論文 参考訳(メタデータ) (2025-03-18T02:33:27Z) - PAFFA: Premeditated Actions For Fast Agents [19.576180667174366]
PAFFAは、新しい推論時間手法を用いて、インターネット上でのタスクの完了を高速かつ正確にする手法である。
PAFFAは、堅牢なパフォーマンスを維持しながら、推論時間トークンを87%大幅に削減する。
調査に基づいてアクションライブラリを更新するUnravelの能力は、目に見えないウェブサイトへの一般化と適応を可能にする。
論文 参考訳(メタデータ) (2024-12-10T22:51:31Z) - DynaSaur: Large Language Agents Beyond Predefined Actions [126.98162266986554]
既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作を動的に生成・構成できるLLMエージェントフレームワークを提案する。
このフレームワークでは、汎用プログラミング言語で書かれたプログラムを生成し実行することで、エージェントが環境と対話する。
論文 参考訳(メタデータ) (2024-11-04T02:08:59Z) - AppAgent v2: Advanced Agent for Flexible Mobile Interactions [57.98933460388985]
本研究は,モバイル機器向けの新しいLLMベースのマルチモーダルエージェントフレームワークを提案する。
我々のエージェントは、様々なアプリケーションにまたがる適応性を高めるフレキシブルなアクション空間を構築する。
本研究は,実世界のシナリオにおいて,フレームワークの優れた性能を実証し,その有効性を確認した。
論文 参考訳(メタデータ) (2024-08-05T06:31:39Z) - Frontend Diffusion: Exploring Intent-Based User Interfaces through Abstract-to-Detailed Task Transitions [1.845645938093348]
ユーザスケッチから高品質なWebサイトを生成するエンドツーエンドツールであるFrontend Diffusionを紹介した。
複雑なタスクにおける人的介入やコミュニケーションコストを低減するために,タスク遷移の可能性を示す。
論文 参考訳(メタデータ) (2024-07-16T20:24:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。