論文の概要: AgentBay: A Hybrid Interaction Sandbox for Seamless Human-AI Intervention in Agentic Systems
- arxiv url: http://arxiv.org/abs/2512.04367v1
- Date: Thu, 04 Dec 2025 01:31:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.949399
- Title: AgentBay: A Hybrid Interaction Sandbox for Seamless Human-AI Intervention in Agentic Systems
- Title(参考訳): AgentBay: エージェントシステムにおけるシームレスヒューマンAIインターベンションのためのハイブリッドインタラクションサンドボックス
- Authors: Yun Piao, Hongbo Min, Hang Su, Leilei Zhang, Lei Wang, Yue Yin, Xiao Wu, Zhejing Xu, Liwei Qu, Hang Li, Xinxin Zeng, Wei Tian, Fei Yu, Xiaowei Li, Jiayi Jiang, Tongxu Liu, Hao Tian, Yufei Que, Xiaobing Tu, Bing Suo, Yuebing Li, Xiangting Chen, Zeen Zhao, Jiaming Tang, Wei Huang, Xuguang Li, Jing Zhao, Jin Li, Jie Shen, Jinkui Ren, Xiantao Zhang,
- Abstract要約: 我々は,ハイブリッドインタラクションのためにゼロから設計された新しいサービスであるAgentBayを紹介する。
AgentBayはセキュアで独立した実行環境を提供する。Windows、Linux、Android、Webブラウザ、インタープリタ。
我々の評価は、セキュリティ、パフォーマンス、タスク完了率の強い結果を示す。
- 参考スコア(独自算出の注目度): 29.451397580654316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of Large Language Models (LLMs) is catalyzing a shift towards autonomous AI Agents capable of executing complex, multi-step tasks. However, these agents remain brittle when faced with real-world exceptions, making Human-in-the-Loop (HITL) supervision essential for mission-critical applications. In this paper, we present AgentBay, a novel sandbox service designed from the ground up for hybrid interaction. AgentBay provides secure, isolated execution environments spanning Windows, Linux, Android, Web Browsers, and Code interpreters. Its core contribution is a unified session accessible via a hybrid control interface: An AI agent can interact programmatically via mainstream interfaces (MCP, Open Source SDK), while a human operator can, at any moment, seamlessly take over full manual control. This seamless intervention is enabled by Adaptive Streaming Protocol (ASP). Unlike traditional VNC/RDP, ASP is specifically engineered for this hybrid use case, delivering an ultra-low-latency, smoother user experience that remains resilient even in weak network environments. It achieves this by dynamically blending command-based and video-based streaming, adapting its encoding strategy based on network conditions and the current controller (AI or human). Our evaluation demonstrates strong results in security, performance, and task completion rates. In a benchmark of complex tasks, the AgentBay (Agent + Human) model achieved more than 48% success rate improvement. Furthermore, our ASP protocol reduces bandwidth consumption by up to 50% compared to standard RDP, and in end-to-end latency with around 5% reduction, especially under poor network conditions. We posit that AgentBay provides a foundational primitive for building the next generation of reliable, human-supervised autonomous systems.
- Abstract(参考訳): 大規模言語モデル(LLM)の急速な進歩は、複雑なマルチステップタスクを実行することができる自律型AIエージェントへのシフトを促している。
しかし、これらのエージェントは現実世界の例外に直面しても不安定であり、ミッションクリティカルなアプリケーションにはHuman-in-the-Loop(HITL)の監督が不可欠である。
本稿では,ハイブリッドインタラクションのためにゼロから設計された新しいサンドボックスサービスであるAgentBayを紹介する。
AgentBayは、Windows、Linux、Android、Webブラウザ、コードインタープリタにまたがるセキュアで独立した実行環境を提供する。
AIエージェントは、メインストリームインターフェース(MCP、Open Source SDK)を介してプログラム的に対話できる一方、人間のオペレータは、いつでも、シームレスに、完全な手動コントロールを引き継ぐことができる。
このシームレスな介入は、Adaptive Streaming Protocol(ASP.NET)によって実現されます。
従来のVNC/RDPとは異なり、ASPはこのハイブリッドユースケースのために特別に設計されている。
コマンドベースのストリーミングとビデオベースのストリーミングを動的にブレンドし、ネットワーク条件と現在のコントローラ(AIまたは人間)に基づいて符号化戦略を適用する。
我々の評価は、セキュリティ、パフォーマンス、タスク完了率の強い結果を示す。
複雑なタスクのベンチマークでは、Agent + Human(エージェントベイ)モデルが48%以上の成功率の改善を達成した。
さらに、我々のASPプロトコルは、標準の RDP と比較して帯域幅を最大50%削減し、特にネットワーク条件の悪い場合、エンド・ツー・エンドのレイテンシを約5%削減する。
我々は、AgentBayが次世代の人間監督型自律システムを構築するための基礎的なプリミティブを提供すると仮定する。
関連論文リスト
- Toward Autonomous O-RAN: A Multi-Scale Agentic AI Framework for Real-Time Network Control and Management [39.17062930275755]
本稿では,オープン無線アクセスネットワーク(O-RAN)のためのマルチスケールエージェントAIフレームワークを提案する。
RANインテリジェンスは、Non-Real-Time (Non-RT), Near-Real-Time (Near-RT), Real-Time (RT)コントロールループにまたがるコーディネート階層として編成される。
これらのエージェントは,標準化されたO-RANインタフェースとテレメトリによってどのように協調するかを示す。
論文 参考訳(メタデータ) (2026-02-15T12:34:01Z) - Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning [62.499592503950026]
大規模言語モデル(LLM)は、ツールや環境とのマルチターンインタラクションを必要とする複雑なタスクを実行するために、自律エージェントに権限を与えている。
完全合成環境生成パイプラインであるエージェント・ワールド・モデル(AWM)を提案する。
私たちは、エージェントがリッチなツールセットと対話できる、毎日のシナリオをカバーする1,000の環境にスケールします。
論文 参考訳(メタデータ) (2026-02-10T18:55:41Z) - ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - Trusted AI Agents in the Cloud [4.2366483628004366]
Omegaは、エンドツーエンドのアイソレーションを強制することによって、信頼できるAIエージェントを可能にするシステムである。
クロスプリンシパル信頼確立による効率的なマルチエージェントオーケストレーションを提供する。
クラウドスケールでの高密度でポリシーに準拠したマルチエージェントデプロイメントを実現すると同時に、高いパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-12-05T18:48:53Z) - UltraCUA: A Foundation Model for Computer Use Agents with Hybrid Action [77.63125913907771]
本稿では,GUIプリミティブと高レベルのプログラムツールコールのギャップを埋める基盤モデルであるUltraCUAを提案する。
7Bおよび32Bモデルによる実験は、最先端のエージェントよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-10-20T17:48:26Z) - VeriOS: Query-Driven Proactive Human-Agent-GUI Interaction for Trustworthy OS Agents [39.3943822850841]
We introduced VeriOS-Agent, a trustworthy OS agent training with a two-stage learning paradigm。
VeriOS-Agentは、最先端技術に対する信頼できないシナリオにおいて、平均的なステップワイドの成功率を20.64%改善することを示す。
論文 参考訳(メタデータ) (2025-09-09T09:46:01Z) - Toward Super Agent System with Hybrid AI Routers [19.22599167969104]
スーパーエージェントは、要約、コーディング、研究など、多様なユーザニーズを満たすことができる。
本稿では,ハイブリッドAIルータを用いたスーパーエージェントシステムの設計について述べる。
マルチモダリティモデルとエッジハードウェアの進歩により、ほとんどの計算はローカルで処理でき、クラウドのコラボレーションは必要なだけである、と私たちは考えています。
論文 参考訳(メタデータ) (2025-04-11T00:54:56Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering [79.07755560048388]
SWEエージェント(SWE-agent)は、LMエージェントが自律的にコンピュータを使用してソフトウェア工学のタスクを解決するシステムである。
SWEエージェントのカスタムエージェントコンピュータインタフェース(ACI)は、エージェントがコードファイルを作成し編集し、リポジトリ全体をナビゲートし、テストやその他のプログラムを実行する能力を著しく向上させる。
我々はSWE-benchとHumanEvalFixのSWE-agentを評価し、それぞれ12.5%と87.7%のパス@1レートで最先端の性能を実現した。
論文 参考訳(メタデータ) (2024-05-06T17:41:33Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。