Fugu-MT 論文翻訳(概要): AgentCgroup: Understanding and Controlling OS Resources of AI Agents

論文の概要: AgentCgroup: Understanding and Controlling OS Resources of AI Agents

arxiv url: http://arxiv.org/abs/2602.09345v1
Date: Tue, 10 Feb 2026 02:37:42 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-11 20:17:43.334853
Title: AgentCgroup: Understanding and Controlling OS Resources of AI Agents
Title（参考訳）: AgentCgroup: AIエージェントのOSリソースの理解と制御
Authors: Yusheng Zheng, Jiakun Fan, Quanzhi Fu, Yiwei Yang, Wei Zhang, Andi Quinn,
Abstract要約: AIエージェントは、サンドボックスコンテナ内でさまざまなツールコールを実行するマルチテナントクラウド環境にますますデプロイされている。サンドボックス型AI符号化エージェントにおけるOSレベルの資源動態の系統的特徴について述べる。予備評価は, マルチテナント分離の改善と資源廃棄物の削減を実証する。
参考スコア（独自算出の注目度）: 2.8139711959925244
License: http://creativecommons.org/licenses/by/4.0/
Abstract: AI agents are increasingly deployed in multi-tenant cloud environments, where they execute diverse tool calls within sandboxed containers, each call with distinct resource demands and rapid fluctuations. We present a systematic characterization of OS-level resource dynamics in sandboxed AI coding agents, analyzing 144 software engineering tasks from the SWE-rebench benchmark across two LLM models. Our measurements reveal that (1) OS-level execution (tool calls, container and agent initialization) accounts for 56-74% of end-to-end task latency; (2) memory, not CPU, is the concurrency bottleneck; (3) memory spikes are tool-call-driven with a up to 15.4x peak-to-average ratio; and (4) resource demands are highly unpredictable across tasks, runs, and models. Comparing these characteristics against serverless, microservice, and batch workloads, we identify three mismatches in existing resource controls: a granularity mismatch (container-level policies vs. tool-call-level dynamics), a responsiveness mismatch (user-space reaction vs. sub-second unpredictable bursts), and an adaptability mismatch (history-based prediction vs. non-deterministic stateful execution). We propose AgentCgroup , an eBPF-based resource controller that addresses these mismatches through hierarchical cgroup structures aligned with tool-call boundaries, in-kernel enforcement via sched_ext and memcg_bpf_ops, and runtime-adaptive policies driven by in-kernel monitoring. Preliminary evaluation demonstrates improved multi-tenant isolation and reduced resource waste.
Abstract（参考訳）: AIエージェントはますますマルチテナントクラウド環境にデプロイされ、サンドボックスコンテナ内でさまざまなツールコールを実行する。サンドボックス型AI符号化エージェントにおけるOSレベルの資源動態の系統的評価を行い、SWE-rebenchベンチマークから2つのLLMモデルにまたがる144のソフトウェアエンジニアリングタスクを解析した。測定の結果,(1)OSレベルの実行(ツールコール,コンテナ,エージェントの初期化)は,エンドツーエンドのタスク遅延の56～74%を占め,(2)CPUではなくメモリが並列ボトルネックであること,(3)メモリスパイクは最大15.4倍のピーク平均比でツールコール駆動であり,(4)リソース要求はタスク,実行,モデル間で予測不能であることがわかった。サーバーレス、マイクロサービス、バッチワークロードに対するこれらの特性を比較して、既存のリソースコントロールにおける3つのミスマッチを識別する。粒度ミスマッチ(コンテナレベルのポリシー対ツールコールレベルのダイナミクス)、応答性ミスマッチ(ユーザ空間の反応対サブ秒の予測不能バースト)、適応性ミスマッチ(履歴ベースの予測と非決定論的ステートフル実行)。ツールコール境界に沿った階層的なcgroup構造,sched_extおよびmemcg_bpf_opsによるカーネル内強制,カーネル内監視によるランタイム適応ポリシを通じて,これらのミスマッチに対処するEBPFベースのリソースコントローラであるAgentCgroupを提案する。予備評価は, マルチテナント分離の改善と資源廃棄物の削減を実証する。

関連論文リスト

AgentSentry: Mitigating Indirect Prompt Injection in LLM Agents via Temporal Causal Diagnostics and Context Purification [25.817251923574286]
大規模言語モデル(LLM)エージェントのための新しい推論時間検出・緩和フレームワークを提案する。 AgentSentryは、時間的因果的テイクオーバーとしてマルチターンIPIをモデル化する最初の推論時防御である。我々は, textscAgentDojo ベンチマークにおいて, 4つのタスクスイート, 3つの IPI 攻撃ファミリー, 複数のブラックボックス LLM に対する AgentSentry の評価を行った。
論文参考訳（メタデータ） (2026-02-26T07:59:10Z)
Learning to Share: Selective Memory for Efficient Parallel Agentic Systems [49.78267008828593]
エージェントシステムは、反復的に推論する複数のエージェントを調整することで複雑なタスクを解決し、ツールを呼び出し、中間結果を交換する。最近のアプローチでは、さまざまな推論の軌跡を探索するために、複数のエージェントチームが並行して運用されている。我々は並列エージェントフレームワークのための学習された共有メモリ機構であるLearning to Share (LTS)を提案する。
論文参考訳（メタデータ） (2026-02-05T18:20:21Z)
UltraCUA: A Foundation Model for Computer Use Agents with Hybrid Action [77.63125913907771]
本稿では,GUIプリミティブと高レベルのプログラムツールコールのギャップを埋める基盤モデルであるUltraCUAを提案する。 7Bおよび32Bモデルによる実験は、最先端のエージェントよりも大幅に改善されている。
論文参考訳（メタデータ） (2025-10-20T17:48:26Z)
AgentAsk: Multi-Agent Systems Need to Ask [26.13279490836716]
大規模言語モデル(LLM)上に構築されたマルチエージェントシステムは、協調的な分業による問題解決能力の向上を約束する。我々はAgentAskを提案する。AgentAskは軽量でプラグ・アンド・プレイの明確化モジュールで、すべてのエージェント間メッセージを潜在的な障害点として扱い、エラーの伝播を抑えるのに必要最小限の質問を挿入する。 AgentAskは、公開マルチエージェント実装の精度と堅牢性を継続的に改善し、オーバーヘッドを最小限に抑え、レイテンシと余分なコストを5%以下に抑える。
論文参考訳（メタデータ） (2025-10-08T22:36:05Z)
Multi-Agent Tool-Integrated Policy Optimization [67.12841355267678]
大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクに対して、多ターンツール統合計画にますます依存している。既存の実装は通常、単一のエージェントに依存するが、コンテキスト長とノイズの多いツールレスポンスに悩まされる。ツール統合マルチエージェントフレームワークの効果的な強化学習をサポートする方法はない。
論文参考訳（メタデータ） (2025-10-06T10:44:04Z)
Towards Agentic OS: An LLM Agent Framework for Linux Schedulers [3.8068085728995307]
我々は、完全に自律的な大規模言語モデル(LLM)エージェントが、人間の関与なしにLinuxスケジューラを安全かつ効率的に最適化できる、最初のフレームワークであるSchedCPを紹介した。評価の結果,SchedCPの性能改善は最大1.79倍,コスト削減は有意なエージェントアプローチに比べて13倍であることがわかった。
論文参考訳（メタデータ） (2025-09-01T08:38:49Z)
RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.449129198822476]
RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文参考訳（メタデータ） (2025-08-06T21:59:34Z)
AgentSight: System-Level Observability for AI Agents Using eBPF [10.37440633887049]
既存のツールは、エージェントの高レベルな意図(LSMプロンプトを介して)または低レベルな行動(例えば、システムコール)を観察するが、これら2つのビューを関連付けることはできない。 AgentOpsはハイブリッドアプローチを使用して,このセマンティックギャップをブリッジする,AgentOpsオブザーバビリティフレームワークです。 AgentSightはTLS暗号化されたLLMトラフィックをインターセプトしてセマンティックインテントを抽出し、カーネルイベントを監視してシステム全体の効果を観察し、これら2つのストリームをプロセス境界を越えて因果的に関連付ける。
論文参考訳（メタデータ） (2025-08-02T01:43:39Z)
Streamlining Resilient Kubernetes Autoscaling with Multi-Agent Systems via an Automated Online Design Framework [0.0]
クラウドネイティブなシステムは、ワークロード管理の貧弱な問題のために、運用上のレジリエンスに直面することが多い。協調エージェントに委譲された障害固有のサブゴールに、運用上のレジリエンスを維持するという、包括的な目標を分解することを提案する。 1)クラスタトレースから構築されたディジタルツインのモデリング,2)障害コンテキストに適した役割やミッションを用いたシミュレーションエージェントのトレーニング,3)説明可能性のためのエージェント動作の解析,4)学習ポリシを実クラスタに転送する。
論文参考訳（メタデータ） (2025-05-26T20:39:31Z)
T^2Agent A Tool-augmented Multimodal Misinformation Detection Agent with Monte Carlo Tree Search [51.91311158085973]
多重モーダル誤報は、しばしば混合偽造源から発生し、動的推論と適応的検証を必要とする。我々はモンテカルロ木探索を用いたツールキットを組み込んだ新しい誤情報検出剤T2Agentを提案する。大規模な実験により、T2Agentは、混在するマルチモーダル誤報ベンチマークにおいて、既存のベースラインを一貫して上回っていることが示されている。
論文参考訳（メタデータ） (2025-05-26T09:50:55Z)
PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文参考訳（メタデータ） (2025-02-20T05:41:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。