論文の概要: AgentBay: A Hybrid Interaction Sandbox for Seamless Human-AI Intervention in Agentic Systems
- arxiv url: http://arxiv.org/abs/2512.04367v1
- Date: Thu, 04 Dec 2025 01:31:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.949399
- Title: AgentBay: A Hybrid Interaction Sandbox for Seamless Human-AI Intervention in Agentic Systems
- Title(参考訳): AgentBay: エージェントシステムにおけるシームレスヒューマンAIインターベンションのためのハイブリッドインタラクションサンドボックス
- Authors: Yun Piao, Hongbo Min, Hang Su, Leilei Zhang, Lei Wang, Yue Yin, Xiao Wu, Zhejing Xu, Liwei Qu, Hang Li, Xinxin Zeng, Wei Tian, Fei Yu, Xiaowei Li, Jiayi Jiang, Tongxu Liu, Hao Tian, Yufei Que, Xiaobing Tu, Bing Suo, Yuebing Li, Xiangting Chen, Zeen Zhao, Jiaming Tang, Wei Huang, Xuguang Li, Jing Zhao, Jin Li, Jie Shen, Jinkui Ren, Xiantao Zhang,
- Abstract要約: 我々は,ハイブリッドインタラクションのためにゼロから設計された新しいサービスであるAgentBayを紹介する。
AgentBayはセキュアで独立した実行環境を提供する。Windows、Linux、Android、Webブラウザ、インタープリタ。
我々の評価は、セキュリティ、パフォーマンス、タスク完了率の強い結果を示す。
- 参考スコア(独自算出の注目度): 29.451397580654316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of Large Language Models (LLMs) is catalyzing a shift towards autonomous AI Agents capable of executing complex, multi-step tasks. However, these agents remain brittle when faced with real-world exceptions, making Human-in-the-Loop (HITL) supervision essential for mission-critical applications. In this paper, we present AgentBay, a novel sandbox service designed from the ground up for hybrid interaction. AgentBay provides secure, isolated execution environments spanning Windows, Linux, Android, Web Browsers, and Code interpreters. Its core contribution is a unified session accessible via a hybrid control interface: An AI agent can interact programmatically via mainstream interfaces (MCP, Open Source SDK), while a human operator can, at any moment, seamlessly take over full manual control. This seamless intervention is enabled by Adaptive Streaming Protocol (ASP). Unlike traditional VNC/RDP, ASP is specifically engineered for this hybrid use case, delivering an ultra-low-latency, smoother user experience that remains resilient even in weak network environments. It achieves this by dynamically blending command-based and video-based streaming, adapting its encoding strategy based on network conditions and the current controller (AI or human). Our evaluation demonstrates strong results in security, performance, and task completion rates. In a benchmark of complex tasks, the AgentBay (Agent + Human) model achieved more than 48% success rate improvement. Furthermore, our ASP protocol reduces bandwidth consumption by up to 50% compared to standard RDP, and in end-to-end latency with around 5% reduction, especially under poor network conditions. We posit that AgentBay provides a foundational primitive for building the next generation of reliable, human-supervised autonomous systems.
- Abstract(参考訳): 大規模言語モデル(LLM)の急速な進歩は、複雑なマルチステップタスクを実行することができる自律型AIエージェントへのシフトを促している。
しかし、これらのエージェントは現実世界の例外に直面しても不安定であり、ミッションクリティカルなアプリケーションにはHuman-in-the-Loop(HITL)の監督が不可欠である。
本稿では,ハイブリッドインタラクションのためにゼロから設計された新しいサンドボックスサービスであるAgentBayを紹介する。
AgentBayは、Windows、Linux、Android、Webブラウザ、コードインタープリタにまたがるセキュアで独立した実行環境を提供する。
AIエージェントは、メインストリームインターフェース(MCP、Open Source SDK)を介してプログラム的に対話できる一方、人間のオペレータは、いつでも、シームレスに、完全な手動コントロールを引き継ぐことができる。
このシームレスな介入は、Adaptive Streaming Protocol(ASP.NET)によって実現されます。
従来のVNC/RDPとは異なり、ASPはこのハイブリッドユースケースのために特別に設計されている。
コマンドベースのストリーミングとビデオベースのストリーミングを動的にブレンドし、ネットワーク条件と現在のコントローラ(AIまたは人間)に基づいて符号化戦略を適用する。
我々の評価は、セキュリティ、パフォーマンス、タスク完了率の強い結果を示す。
複雑なタスクのベンチマークでは、Agent + Human(エージェントベイ)モデルが48%以上の成功率の改善を達成した。
さらに、我々のASPプロトコルは、標準の RDP と比較して帯域幅を最大50%削減し、特にネットワーク条件の悪い場合、エンド・ツー・エンドのレイテンシを約5%削減する。
我々は、AgentBayが次世代の人間監督型自律システムを構築するための基礎的なプリミティブを提供すると仮定する。
関連論文リスト
- VeriOS: Query-Driven Proactive Human-Agent-GUI Interaction for Trustworthy OS Agents [39.3943822850841]
We introduced VeriOS-Agent, a trustworthy OS agent training with a two-stage learning paradigm。
VeriOS-Agentは、最先端技術に対する信頼できないシナリオにおいて、平均的なステップワイドの成功率を20.64%改善することを示す。
論文 参考訳(メタデータ) (2025-09-09T09:46:01Z) - Toward Super Agent System with Hybrid AI Routers [19.22599167969104]
スーパーエージェントは、要約、コーディング、研究など、多様なユーザニーズを満たすことができる。
本稿では,ハイブリッドAIルータを用いたスーパーエージェントシステムの設計について述べる。
マルチモダリティモデルとエッジハードウェアの進歩により、ほとんどの計算はローカルで処理でき、クラウドのコラボレーションは必要なだけである、と私たちは考えています。
論文 参考訳(メタデータ) (2025-04-11T00:54:56Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。