論文の概要: Internal APIs Are All You Need: Shadow APIs, Shared Discovery, and the Case Against Browser-First Agent Architectures
- arxiv url: http://arxiv.org/abs/2604.00694v1
- Date: Wed, 01 Apr 2026 09:51:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.92936
- Title: Internal APIs Are All You Need: Shadow APIs, Shared Discovery, and the Case Against Browser-First Agent Architectures
- Title(参考訳): 内部APIがすべて必要:シャドウAPI、共有ディスカバリ、ブラウザファーストのエージェントアーキテクチャに対する訴訟
- Authors: Lewis Tham, Nicholas Mac Gregor Garcia, Jungpil Hahn,
- Abstract要約: Unbrowseは共有ルートグラフで、ブラウザベースのルート発見を集合的に保持されたインデックスに変換する。
このシステムは、実際のブラウジングトラフィックからルートを受動的に学習し、直接API呼び出しを通じてキャッシュされたルートを提供する。
3パス実行モデル -- ローカルキャッシュ、共有グラフ、ブラウザフォールバック -- は、システムが自発的で自己修正可能であることを保証します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous agents increasingly interact with the web, yet most websites remain designed for human browsers -- a fundamental mismatch that the emerging ``Agentic Web'' must resolve. Agents must repeatedly browse pages, inspect DOMs, and reverse-engineer callable routes -- a process that is slow, brittle, and redundantly repeated across agents. We observe that every modern website already exposes internal APIs (sometimes called \emph{shadow APIs}) behind its user interface -- first-party endpoints that power the site's own functionality. We present Unbrowse, a shared route graph that transforms browser-based route discovery into a collectively maintained index of these callable first-party interfaces. The system passively learns routes from real browsing traffic and serves cached routes via direct API calls. In a single-host live-web benchmark of equivalent information-retrieval tasks across 94 domains, fully warmed cached execution averaged 950\,ms versus 3{,}404\,ms for Playwright browser automation (3.6$\times$ mean speedup, 5.4$\times$ median), with well-cached routes completing in under 100\,ms. A three-path execution model -- local cache, shared graph, or browser fallback -- ensures the system is voluntary and self-correcting. A three-tier micropayment model via the x402 protocol charges per-query search fees for graph lookups (Tier~3), a one-time install fee for discovery documentation (Tier~1), and optional per-execution fees for site owners who opt in (Tier~2). All tiers are grounded in a necessary condition for rational adoption: an agent uses the shared graph only when the total fee is lower than the expected cost of browser rediscovery.
- Abstract(参考訳): 自律的なエージェントはますますWebと対話するが、ほとんどのWebサイトは、人間のブラウザ用に設計されている。
エージェントは、ページを何度も閲覧し、DOMを検査し、リバースエンジニアリングの呼び出し可能なルート -- エージェント間で遅く、脆く、冗長に繰り返されるプロセス -- を検査しなければならない。現代的なWebサイトはすべて、ユーザインターフェースの後方にある内部API(時には \emph{shadow API} と呼ばれる)をすでに公開しており、サイト自身の機能を支える第1のサードパーティのエンドポイントを公開している。
ブラウザベースの経路探索を,コール可能なファーストパーティインターフェースの総合的なインデックスに変換する,共有ルートグラフUnbrowseを提案する。
このシステムは、実際のブラウジングトラフィックからルートを受動的に学習し、直接API呼び出しを通じてキャッシュされたルートを提供する。
94ドメインにまたがる同等の情報検索タスクのシングルホストのライブウェブベンチマークでは、完全にキャッシュされた実行は平均950\,ms vs 3{,}404\,ms for Playwright browser automation (3.6$\times$ mean speedup, 5.4$\times$ median)で、十分にキャッシュされたルートは100\,ms以下である。
3パス実行モデル -- ローカルキャッシュ、共有グラフ、ブラウザフォールバック -- は、システムが自発的で自己修正可能であることを保証します。
x402プロトコルによる3層マイクロペイメントモデルでは、グラフ検索のためのクエリ毎の検索料金(Tier~3)、発見ドキュメントの1回インストール料金(Tier~1)、オプトインするサイト所有者のためのオプション1回の実行料金(Tier~2)が課金される。
エージェントが共有グラフを使用するのは、ブラウザの再調査の期待されるコストよりも総料金が低い場合に限られます。
関連論文リスト
- EmbeWebAgent: Embedding Web Agents into Any Customized UI [3.034887612600091]
EmbeWebAgentはエージェントを直接既存のUIに埋め込むフレームワークです。
プリミティブからハイレベルコンポジットまで、混合粒度作用をサポートする。
私たちのデモでは、ライブUI設定で最小限の再適合と堅牢なマルチステップ動作を示しています。
論文 参考訳(メタデータ) (2026-02-16T15:59:56Z) - GUI-360$^\circ$: A Comprehensive Dataset and Benchmark for Computer-Using Agents [59.107657859025586]
GUI-360$circ$は、コンピュータ利用エージェント(CUA)を進化させるために設計された大規模で包括的なデータセットとベンチマークスイートである。
リリースされたコーパスには、人気のあるWindowsオフィスアプリケーションにおける数千のトラジェクトリにわたる1.2万以上の実行されたアクションステップが含まれている。
このデータセットは、3つの標準タスク、GUIグラウンド、スクリーン解析、アクション予測、ハイブリッドGUI+APIアクションスペースをサポートする。
論文 参考訳(メタデータ) (2025-11-06T12:19:02Z) - BrowserArena: Evaluating LLM Agents on Real-World Web Navigation Tasks [51.803138848305814]
我々はBrowserArenaを紹介した。BrowserArenaは、ユーザから送信されたタスクを収集するオープンソースのエージェント評価プラットフォームである。
Captcha解決、ポップアップバナー削除、URLへのダイレクトナビゲーションの3つの一貫した障害モードを特定します。
本研究は,Webエージェントの多様性と脆性の両方を明らかにする。
論文 参考訳(メタデータ) (2025-10-02T15:22:21Z) - Infogent: An Agent-Based Framework for Web Information Aggregation [59.67710556177564]
我々はWeb情報集約のための新しいフレームワークInfogentを紹介する。
異なる情報アクセス設定の実験では、Infogentが既存のSOTAマルチエージェント検索フレームワークを7%上回った。
論文 参考訳(メタデータ) (2024-10-24T18:01:28Z) - Beyond Browsing: API-Based Web Agents [58.39129004543844]
APIベースのエージェントはWebArenaの実験でWebブラウザエージェントを上回っている。
ハイブリッドエージェント(Hybrid Agents)は、タスク全体にわたって、ほぼ均一にパフォーマンスを向上する。
結果から,APIが利用可能であれば,Webブラウジングのみに依存するという,魅力的な代替手段が提示されることが強く示唆された。
論文 参考訳(メタデータ) (2024-10-21T19:46:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。