論文の概要: Orca: Browsing at Scale Through User-Driven and AI-Facilitated Orchestration Across Malleable Webpages
- arxiv url: http://arxiv.org/abs/2505.22831v1
- Date: Wed, 28 May 2025 20:13:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.518084
- Title: Orca: Browsing at Scale Through User-Driven and AI-Facilitated Orchestration Across Malleable Webpages
- Title(参考訳): Orca: 悪意のあるWebページをまたいだユーザ駆動とAI対応のオーケストレーションを通じて、大規模にブラウジングする
- Authors: Peiling Jiang, Haijun Xia,
- Abstract要約: プロトタイプのWebブラウザであるOrcaとの新しいインタラクションを提示する。
Orcaは、大規模にWebコンテンツの探索、運用、組織化、合成をサポートする。
評価の結果,情報収集,ユーザコントロールの強化,およびWeb上のより広い情報空間における感覚形成の柔軟性向上に対する「期待」が明らかにされた。
- 参考スコア(独自算出の注目度): 18.25019078938821
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Web-based activities are fundamentally distributed across webpages. However, conventional browsers with stacks of tabs fail to support operating and synthesizing large volumes of information across pages. While recent AI systems enable fully automated web browsing and information synthesis, they often diminish user agency and hinder contextual understanding. Therefore, we explore how AI could instead augment users' interactions with content across webpages and mitigate cognitive and manual efforts. Through literature on information tasks and web browsing challenges, and an iterative design process, we present a rich set of novel interactions with our prototype web browser, Orca. Leveraging AI, Orca supports user-driven exploration, operation, organization, and synthesis of web content at scale. To enable browsing at scale, webpages are treated as malleable materials that humans and AI can collaboratively manipulate and compose into a malleable, dynamic, and browser-level workspace. Our evaluation revealed an increased "appetite" for information foraging, enhanced user control, and more flexibility in sensemaking across a broader information landscape on the web.
- Abstract(参考訳): Webベースのアクティビティは、基本的にWebページに分散しています。
しかし、タブのスタックを持つ従来のブラウザは、ページをまたいだ大量の情報の操作と合成をサポートしない。
最近のAIシステムは、完全に自動化されたWebブラウジングと情報合成を可能にするが、ユーザエージェンシーを減らし、コンテキスト理解を妨げることが多い。
そこで我々は,AIがユーザとWebページをまたいだコンテンツとのインタラクションを強化し,認知と手作業の軽減を実現する方法について検討する。
情報タスクやWebブラウジングの課題に関する文献や反復的な設計プロセスを通じて、プロトタイプのWebブラウザであるOrcaとの新しいインタラクションの豊富なセットを提示する。
AIを活用することで、Orcaは、大規模にWebコンテンツの探索、運用、組織化、合成をサポートする。
大規模なブラウジングを可能にするため、Webページは、人間とAIが共同で操作し、可鍛性、動的、ブラウザレベルのワークスペースに構成できる、可鍛性のある素材として扱われる。
評価の結果,情報収集,ユーザコントロールの強化,およびWeb上のより広い情報空間における感覚形成の柔軟性向上に対する「期待」が明らかにされた。
関連論文リスト
- WebThinker: Empowering Large Reasoning Models with Deep Research Capability [60.81964498221952]
WebThinkerは、大規模な推論モデルに、Webを自律的に検索し、Webページをナビゲートし、推論プロセス中に研究レポートをドラフトする権限を与えるディープリサーチエージェントである。
また、textbf Autonomous Think-Search-and-Draft戦略を採用しており、モデルがシームレスに推論、情報収集、レポート作成をリアルタイムで行うことができる。
我々のアプローチは複雑なシナリオにおけるLEMの信頼性と適用性を高め、より有能で多目的な深層研究システムへの道を開く。
論文 参考訳(メタデータ) (2025-04-30T16:25:25Z) - WebGames: Challenging General-Purpose Web-Browsing AI Agents [11.320069795732058]
WebGamesは汎用的なWebブラウザAIエージェントを評価するために設計された包括的なベンチマークスイートである。
GPT-4o, Claude Computer-Use, Gemini-1.5-Pro, Qwen2-VLなどの視覚言語モデルを人為的性能に対して評価した。
その結果、最高のAIシステムは、人間のパフォーマンスが95.7%であるのに対して、43.1%の成功率しか達成していない。
論文 参考訳(メタデータ) (2025-02-25T16:45:08Z) - Biotic Browser: Applying StreamingLLM as a Persistent Web Browsing Co-Pilot [0.0]
Biotic Browser"は、StreamingLLMを利用してWebナビゲーションとタスク実行を変換する革新的なAIアシスタントである。
自動運転車の乗客の体験をシミュレートする能力によって特徴付けられるBiotic Browserは、拡張されたインタラクションや複雑なマルチステップのWebベースのタスクの管理に長けている。
論文 参考訳(メタデータ) (2024-10-31T16:12:02Z) - Survey of User Interface Design and Interaction Techniques in Generative AI Applications [79.55963742878684]
我々は,デザイナやディベロッパの参照として使用できる,さまざまなユーザインタラクションパターンのコンペレーションを作ることを目指している。
また、生成AIアプリケーションの設計についてもっと学ぼうとする人たちの参入障壁を低くしようと努力しています。
論文 参考訳(メタデータ) (2024-10-28T23:10:06Z) - AUTONODE: A Neuro-Graphic Self-Learnable Engine for Cognitive GUI Automation [0.0]
オンラインニューログラフィック操作と深部探索によるユーザインタフェースの自律的変換
我々のエンジンはエージェントが複雑に理解し実装し、非並列な効率で動的Web環境に適応することを可能にする。
AUTONODEの汎用性と有効性は一連の実験を通じて実証され、様々なWebベースのタスクを管理する能力を強調している。
論文 参考訳(メタデータ) (2024-03-15T10:27:17Z) - VisualWebArena: Evaluating Multimodal Agents on Realistic Visual Web Tasks [93.85005277463802]
VisualWebArenaは、マルチモーダルWebエージェントのパフォーマンスを現実的なタスクで評価するために設計されたベンチマークである。
このベンチマークを実行するには、イメージテキスト入力を正確に処理し、自然言語命令を解釈し、ユーザが定義した目的を達成するためにウェブサイト上でアクションを実行する必要がある。
論文 参考訳(メタデータ) (2024-01-24T18:35:21Z) - Exploring the Potential of Generative AI for the World Wide Web [0.94491536689161]
我々は、World Wide Webの領域における生成AIの可能性を探る。
Web開発者は、すでに生成AIを使用してテキストや画像の作成を支援している。
Webブラウザは将来、壊れたWebページの修復、帯域幅の保存、プライバシーの強化といったタスクのために、ローカルに画像を生成するためにそれを使うかもしれない。
論文 参考訳(メタデータ) (2023-10-26T13:02:45Z) - Adversarial Environment Generation for Learning to Navigate the Web [107.99759923626242]
Webナビゲーションエージェントのトレーニングのボトルネックの1つは、トレーニング環境の学習可能なカリキュラムを提供することです。
AEG(Adversarial Environment Generation)を使用して、強化学習(RL)エージェントを訓練する困難なWeb環境を生成することを提案する。
提案するフレキシブルb-PAIRED技術を用いて訓練したナビゲータエージェントは,競争力のある自動カリキュラム生成ベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-03-02T19:19:30Z) - Bringing Cognitive Augmentation to Web Browsing Accessibility [69.62988485669146]
我々は、より自然でアクセス可能なwebブラウジング体験を提供するための認知的拡張によってもたらされる機会を探求する。
我々は,BVIP対話型Webブラウジングニーズを支援するための概念的フレームワークを開発する。
構造的特徴とコンテンツ機能のみを考慮した初期の作業とプロトタイプについて説明する。
論文 参考訳(メタデータ) (2020-12-07T14:40:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。