論文の概要: A Survey on AgentOps: Categorization, Challenges, and Future Directions
- arxiv url: http://arxiv.org/abs/2508.02121v1
- Date: Mon, 04 Aug 2025 06:59:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.213262
- Title: A Survey on AgentOps: Categorization, Challenges, and Future Directions
- Title(参考訳): AgentOpsに関する調査 - 分類,課題,今後の方向性
- Authors: Zexin Wang, Jingjing Li, Quan Zhou, Haotian Si, Yuanhao Liu, Jianhui Li, Gaogang Xie, Fei Sun, Dan Pei, Changhua Pei,
- Abstract要約: 本稿ではエージェントシステムオペレーション(AgentOps)と呼ばれるエージェントシステムのための新しい包括的な運用フレームワークを紹介する。
モニタリング,異常検出,根本原因分析,解決の4つの重要な段階について,詳細な定義と説明を行う。
- 参考スコア(独自算出の注目度): 25.00082531560766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the reasoning capabilities of Large Language Models (LLMs) continue to advance, LLM-based agent systems offer advantages in flexibility and interpretability over traditional systems, garnering increasing attention. However, despite the widespread research interest and industrial application of agent systems, these systems, like their traditional counterparts, frequently encounter anomalies. These anomalies lead to instability and insecurity, hindering their further development. Therefore, a comprehensive and systematic approach to the operation and maintenance of agent systems is urgently needed. Unfortunately, current research on the operations of agent systems is sparse. To address this gap, we have undertaken a survey on agent system operations with the aim of establishing a clear framework for the field, defining the challenges, and facilitating further development. Specifically, this paper begins by systematically defining anomalies within agent systems, categorizing them into intra-agent anomalies and inter-agent anomalies. Next, we introduce a novel and comprehensive operational framework for agent systems, dubbed Agent System Operations (AgentOps). We provide detailed definitions and explanations of its four key stages: monitoring, anomaly detection, root cause analysis, and resolution.
- Abstract(参考訳): LLM(Large Language Models)の推論能力が向上するにつれて、LLMベースのエージェントシステムは従来のシステムよりも柔軟性と解釈可能性の利点を提供し、注目を集めている。
しかしながら、エージェントシステムの幅広い研究関心と工業的応用にもかかわらず、これらのシステムは従来のシステムと同様に、しばしば異常に遭遇する。
これらの異常は不安定性と不安を招き、さらなる発展を妨げる。
そのため,エージェントシステムの運用・保守に対する包括的かつ体系的なアプローチが急務である。
残念ながら、エージェントシステムの運用に関する現在の研究は少ない。
このギャップに対処するため、我々は、この分野の明確な枠組みを確立し、課題を定義し、さらなる開発を促進することを目的として、エージェント・システム・オペレーションに関する調査を実施してきた。
具体的には,エージェントシステム内の異常を体系的に定義し,それらをエージェント内異常とエージェント間異常に分類することから始める。
次に、エージェントシステムオペレーション(AgentOps)と呼ばれるエージェントシステムのための、新しく包括的な運用フレームワークを紹介する。
モニタリング,異常検出,根本原因分析,解決の4つの重要な段階について,詳細な定義と説明を行う。
関連論文リスト
- SafeMobile: Chain-level Jailbreak Detection and Automated Evaluation for Multimodal Mobile Agents [58.21223208538351]
本研究は,モバイルマルチモーダルエージェントを取り巻くセキュリティ問題について考察する。
行動シーケンス情報を組み込んだリスク識別機構の構築を試みる。
また、大規模言語モデルに基づく自動アセスメントスキームも設計している。
論文 参考訳(メタデータ) (2025-07-01T15:10:00Z) - Deep Research Agents: A Systematic Examination And Roadmap [79.04813794804377]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - SentinelAgent: Graph-based Anomaly Detection in Multi-Agent Systems [11.497269773189254]
大規模言語モデル(LLM)に基づくマルチエージェントシステム(MAS)に適したシステムレベルの異常検出フレームワークを提案する。
本稿では,エージェント間相互作用を動的実行グラフとしてモデル化し,ノード,エッジ,パスレベルでの意味的異常検出を可能にするグラフベースのフレームワークを提案する。
第2に,セキュリティポリシとコンテキスト推論に基づくMAS実行の監視,解析,介入を行うLLMによる監視エージェントである,プラグイン可能なSentinelAgentを導入する。
論文 参考訳(メタデータ) (2025-05-30T04:25:19Z) - Inherent and emergent liability issues in LLM-based agentic systems: a principal-agent perspective [0.0]
大規模言語モデル(LLM)を利用したエージェントシステムは、徐々に複雑になり、能力も向上している。
エージェントの増加とデプロイメント設定の拡大は、効果的なガバナンスポリシや監視、コントロールプロトコルへの関心の高まりを招いている。
我々は, LLMエージェントとその拡張システムの委譲利用による潜在的な責任問題について, プリンシパル・エージェントの観点から分析する。
論文 参考訳(メタデータ) (2025-04-04T08:10:02Z) - Multi-Agent Risks from Advanced AI [90.74347101431474]
先進的なAIのマルチエージェントシステムは、新規で未発見のリスクを生じさせる。
エージェントのインセンティブに基づく3つの重要な障害モードと7つの重要なリスク要因を同定する。
各リスクのいくつかの重要な事例と、それらを緩和するための有望な方向性を強調します。
論文 参考訳(メタデータ) (2025-02-19T23:03:21Z) - Agent-as-a-Judge: Evaluate Agents with Agents [61.33974108405561]
本稿ではエージェント・アズ・ア・ジャッジ(Agent-as-a-Judge)フレームワークを紹介し,エージェント・システムを用いてエージェント・システムの評価を行う。
これはLLM-as-a-Judgeフレームワークの有機的拡張であり、タスク解決プロセス全体の中間フィードバックを可能にするエージェント的特徴を取り入れている。
55のリアルな自動化AI開発タスクのベンチマークであるDevAIを紹介します。
論文 参考訳(メタデータ) (2024-10-14T17:57:02Z) - Preparing for Super-Reactivity: Early Fault-Detection in the Development of Exceedingly Complex Reactive Systems [1.6298172960110866]
構築と振る舞いが複雑で、常に変化し、進化しているリアクティブシステムを指すために、Super-Reactive Systemsという用語を紹介します。
計画と開発の初期段階でそのようなシステムに隠れた欠陥を見つけることは、人間の安全、環境、社会、経済にとって重要である。
本稿では,障壁を克服し,シミュレーション,系統解析,故障検出とハンドリングを可能にするモデルとツールのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-10-03T16:08:30Z) - EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。
EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2024-06-20T11:49:23Z) - A Survey on Context-Aware Multi-Agent Systems: Techniques, Challenges and Future Directions [1.0488897291370285]
自律型エージェントに対する研究の関心が高まっている。
課題は、これらのエージェントが動的環境における不確実性を学び、推論し、ナビゲートできるようにすることである。
コンテキスト認識は、マルチエージェントシステムの強化において重要な要素として現れる。
論文 参考訳(メタデータ) (2024-02-03T00:27:22Z) - A Hierarchical Framework with Spatio-Temporal Consistency Learning for Emergence Detection in Complex Adaptive Systems [41.055298739292695]
複雑な適応システムのグローバルな特性であるEmergenceは、例えばネットワークレベルのトラフィック混雑など、現実世界の動的システムで広く利用されている。
本稿では,システム表現とエージェント表現を学習することで,これら2つの問題を解決するために,CASの時間的一貫性を備えた階層型フレームワークを提案する。
提案手法は,3つのデータセットに対する従来の手法や深層学習法よりも,検出の難しい動作をよく知ることができる。
論文 参考訳(メタデータ) (2024-01-18T08:55:05Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Harms from Increasingly Agentic Algorithmic Systems [21.613581713046464]
公正性、説明責任、透明性、倫理(FATE)の研究は、多くのアルゴリズム的害の源泉と形態を確立している。
継続的な被害にもかかわらず、同じ害の永続性を脅かす新しいシステムが開発され、展開されている。
論文 参考訳(メタデータ) (2023-02-20T21:42:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。