Fugu-MT 論文翻訳(概要): Permission Manifests for Web Agents

論文の概要: Permission Manifests for Web Agents

arxiv url: http://arxiv.org/abs/2601.02371v1
Date: Sun, 07 Dec 2025 17:45:01 GMT
ステータス: 翻訳完了
システム内更新日: 2026-01-11 18:48:17.544896
Title: Permission Manifests for Web Agents
Title（参考訳）: Webエージェントのパーミッションマニフェスト
Authors: Samuele Marro, Alan Chan, Xinxing Ren, Lewis Hammond, Jesse Wright, Gurjyot Wanga, Tiziano Piccardi, Nuno Campos, Tobin South, Jialin Yu, Alex Pentland, Philip Torr, Jiaxin Pei,
Abstract要約: LLM(Large Language Model)ベースのWebエージェントの台頭は、Webとの対話の自動化において、大きな変化をもたらしている。どのインタラクションが許可されているかを指定する方法がないため、Webサイトオーナーはますます、ブランケットブロッキングとCAPTCHAに依存している。ロボット.txtスタイルのインターフェースマニフェストであるエージェントパーミッションを導入し,API参照によって補完される,Webサイトが許可されたインタラクションを指定する。
参考スコア（独自算出の注目度）: 30.22217505383227
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The rise of Large Language Model (LLM)-based web agents represents a significant shift in automated interactions with the web. Unlike traditional crawlers that follow simple conventions, such as robots.txt, modern agents engage with websites in sophisticated ways: navigating complex interfaces, extracting structured information, and completing end-to-end tasks. Existing governance mechanisms were not designed for these capabilities. Without a way to specify what interactions are and are not allowed, website owners increasingly rely on blanket blocking and CAPTCHAs, which undermine beneficial applications such as efficient automation, convenient use of e-commerce services, and accessibility tools. We introduce agent-permissions.json, a robots.txt-style lightweight manifest where websites specify allowed interactions, complemented by API references where available. This framework provides a low-friction coordination mechanism: website owners only need to write a simple JSON file, while agents can easily parse and automatically implement the manifest's provisions. Website owners can then focus on blocking non-compliant agents, rather than agents as a whole. By extending the spirit of robots.txt to the era of LLM-mediated interaction, and complementing data use initiatives such as AIPref, the manifest establishes a compliance framework that enables beneficial agent interactions while respecting site owners' preferences.
Abstract（参考訳）: LLM(Large Language Model)ベースのWebエージェントの台頭は、Webとの対話の自動化において、大きな変化をもたらしている。ロボット.txtのような単純な慣習に従う伝統的なクローラーとは異なり、現代のエージェントは複雑なインターフェースのナビゲート、構造化された情報の抽出、エンドツーエンドのタスクの完了など、洗練された方法でウェブサイトを利用する。既存のガバナンスメカニズムは、これらの機能のために設計されていない。どのインタラクションが許可されていないかを指定する方法がないため、Webサイトオーナーは、効率的な自動化やeコマースサービスの便利な利用、アクセシビリティツールといった有益なアプリケーションを損なう、ブランケットブロックやCAPTCHAにますます依存しています。ロボット.txtスタイルの軽量マニフェストである agent-permissions.json を導入し、Webサイトが許可されたインタラクションを指定し、利用可能なAPI参照で補完する。 Webサイトオーナーは単純なJSONファイルを書くだけでいいし、エージェントは簡単に解析してマニフェストの条項を自動的に実装できる。ウェブサイトのオーナーは、エージェント全体ではなく、非準拠のエージェントをブロックすることに集中することができる。ロボット.txt の精神を LLM によるインタラクションの時代まで拡張し、AIPref などのデータ利用イニシアチブを補完することにより、サイトの所有者の好みを尊重しながら、有益なエージェントインタラクションを可能にするコンプライアンスフレームワークを確立する。

関連論文リスト

Web Verbs: Typed Abstractions for Reliable Task Composition on the Agentic Web [17.537750923987762]
現在のWebエージェントは、クリックやキーストロークのような低レベルのプリミティブで動作する。エージェントWebはWebアクションのセマンティックレイヤも必要としています。我々は、型付き、意味的に文書化された関数のWebスケールセットである textbfWeb Verbs を提案する。
論文参考訳（メタデータ） (2026-02-19T10:50:52Z)
Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts [59.68272935616536]
Avenir-Webは、現実世界のデプロイにおいて、Online-Mind2Webベンチマークの新たなオープンソース状態を達成するWebエージェントである。 Avenir-Web on Online-Mind2Web, a rigorous benchmark of live and user-centered web task。
論文参考訳（メタデータ） (2026-02-02T18:50:07Z)
Building the Web for Agents: A Declarative Framework for Agent-Web Interaction [0.7116403133334644]
我々は、WebサイトがAIエージェントの信頼性、監査可能、プライバシ保護機能を公開できるWebネイティブフレームワークVOIXを紹介した。 VOIXはツール>とコンテキスト>タグを導入し、開発者は利用可能なアクションと関連する状態を明確に定義できる。 16人の開発者を対象とした3日間のハッカソン研究で,本フレームワークの実用性,学習性,表現性を評価した。
論文参考訳（メタデータ） (2025-11-14T13:23:34Z)
WALT: Web Agents that Learn Tools [66.73502484310121]
WALTは、Webサイト機能を再利用不能なツールにリバースエンジニアリングするフレームワークである。 WALTはアドホックなスキルを仮説化するのではなく、既にウェブサイトに設計されている自動化の堅牢な実装を公開している。 VisualWebArenaとWebArenaでは、WALTはより少ないステップとLLM依存の推論でより高い成功を達成している。
論文参考訳（メタデータ） (2025-10-01T23:41:47Z)
webMCP: Efficient AI-Native Client-Side Interaction for Agent-Ready Web Design [0.0]
現在のAIエージェントは、Webページを理解するために広範な処理を必要とすることで、ユーザにとって大きな障壁を生み出します。本稿では,Webページに直接構造化されたインタラクションメタデータを埋め込むクライアントサイド標準であるWebMCPを紹介する。 webMCPは処理要求を67.6%削減し、97.9%のタスク成功率を維持している。ユーザはコストを大幅に削減し(34-63%の削減)、さまざまなWebインタラクションでレスポンス時間を短縮する。
論文参考訳（メタデータ） (2025-08-06T23:02:36Z)
Agentic Web: Weaving the Next Web with AI Agents [109.13815627467514]
大規模言語モデル(LLM)を活用したAIエージェントの出現は、エージェントWebに対する重要な転換点である。このパラダイムでは、エージェントが直接対話して、ユーザに代わって複雑なタスクを計画、コーディネート、実行します。本稿では,エージェントWebの理解と構築のための構造化フレームワークを提案する。
論文参考訳（メタデータ） (2025-07-28T17:58:12Z)
Manipulating LLM Web Agents with Indirect Prompt Injection Attack via HTML Accessibility Tree [8.511846002129522]
敵はWebページHTMLにユニバーサルな敵のトリガーを埋め込んでエージェントの動作をハイジャックできることを示す。本システムは,ターゲット攻撃と一般攻撃の両方において,実際のWebサイト間で高い成功率を示す。
論文参考訳（メタデータ） (2025-07-20T03:10:13Z)
Build the web for agents, not agents for the web [27.969222950526703]
本稿では,エージェントがWebサイトをナビゲートするためのインターフェースであるAWI(Agentic Web Interface)の概念を紹介する。 AWI設計の原則を6つ確立し,安全性,効率,標準化を重視した。このリフレーミングは、既存のインターフェイスの基本的な制限を克服し、より効率的で信頼性があり透明なWebエージェント設計への道を開くことを目的としています。
論文参考訳（メタデータ） (2025-06-12T17:53:58Z)
PAFFA: Premeditated Actions For Fast Agents [19.576180667174366]
PAFFAは、新しい推論時間手法を用いて、インターネット上でのタスクの完了を高速かつ正確にする手法である。 PAFFAは、堅牢なパフォーマンスを維持しながら、推論時間トークンを87%大幅に削減する。調査に基づいてアクションライブラリを更新するUnravelの能力は、目に見えないウェブサイトへの一般化と適応を可能にする。
論文参考訳（メタデータ） (2024-12-10T22:51:31Z)
Beyond Browsing: API-Based Web Agents [58.39129004543844]
APIベースのエージェントはWebArenaの実験でWebブラウザエージェントを上回っている。ハイブリッドエージェント(Hybrid Agents)は、タスク全体にわたって、ほぼ均一にパフォーマンスを向上する。結果から,APIが利用可能であれば,Webブラウジングのみに依存するという,魅力的な代替手段が提示されることが強く示唆された。
論文参考訳（メタデータ） (2024-10-21T19:46:06Z)
AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。 AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文参考訳（メタデータ） (2024-10-17T17:50:38Z)
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。 IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文参考訳（メタデータ） (2024-07-09T17:33:24Z)
CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only [21.054681757006385]
本稿では,スクリーンショット画像のみを通して環境を知覚するエージェントを提案する。大規模言語モデルの推論能力を活用することで,大規模人間の実演データの必要性を解消する。 AgentはMiniWoB++の平均成功率は94.5%、WebShopの平均タスクスコアは62.3である。
論文参考訳（メタデータ） (2024-06-11T05:21:20Z)
AutoScraper: A Progressive Understanding Web Agent for Web Scraper Generation [54.17246674188208]
Webスクレイピングは、Webサイトからデータを抽出し、自動データ収集を可能にし、データ分析機能を強化し、手動のデータ入力作業を最小化する強力なテクニックである。既存の手法では、ラッパーベースの手法は、新しいウェブサイトで直面する場合、適応性とスケーラビリティの制限に悩まされる。本稿では,大規模言語モデル(LLM)を用いたWebスクレイパー生成のパラダイムを紹介し,多様なWeb環境をより効率的に処理できる2段階フレームワークであるAutoScraperを提案する。
論文参考訳（メタデータ） (2024-04-19T09:59:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。