Fugu-MT 論文翻訳(概要): Large Language Models for Agentic NetOps and AIOps: Architectures, Evaluation, and Safety

論文の概要: Large Language Models for Agentic NetOps and AIOps: Architectures, Evaluation, and Safety

arxiv url: http://arxiv.org/abs/2605.12729v1
Date: Tue, 12 May 2026 20:31:41 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-14 23:30:27.676955
Title: Large Language Models for Agentic NetOps and AIOps: Architectures, Evaluation, and Safety
Title（参考訳）: エージェントネットOpsとAIOpsのための大規模言語モデル - アーキテクチャ、評価、安全性
Authors: Muhammad Bilal, Jon Crowcroft, Ruizhi Wang, Xiaolong Xu, Schahram Dustdar,
Abstract要約: 大規模言語モデルは、ネットワークオペレーション(NetOps)とITオペレーションのための人工知能(AIOps)をサポートするために、ますます使用されている。 NetOpsとAIOpsでは、このシフトがタスクの管理方法を変えています。エージェントベースのオペレーションは、エビデンス収集からアクションの実施、パーミッション、ポリシー、チェックの追跡、必要に応じてロールバックオプションの提供に至るまで、管理されている。
参考スコア（独自算出の注目度）: 14.195825134031795
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models are increasingly being used to support network operations (NetOps) and artificial intelligence for IT operations (AIOps), including incident investigation, root-cause analysis, configuration synthesis, and limited self-healing. In both NetOps and AIOps, this shift is changing how tasks are managed. Agent-based operations work as workflows, from gathering evidence to taking action, following permissions, policies, and checks, and providing rollback options when necessary. This is crucial because operational decisions can have instant impacts. To make the argument concrete, we organise the relevant literature around the hierarchy of autonomy, tool scope, evidence traces, and assurance contracts. These contracts define what an agent may observe, propose, and execute. They also define the checks that must pass before any action is allowed. A consistent pattern appears across work on telemetry query recommendation, diagnosis, root-cause analysis, configuration synthesis, change planning, and limited self-healing. Operational reliability does not come chiefly from the model itself. It depends on the machinery around the model. We also argue that evaluation should go beyond static question answering. Agentic NetOps and AIOps systems require workflow-centred evaluation, including trace quality, bounded tool use, safe proposal generation, replay in sandboxed environments, and canary trials with rollback-aware scoring. Without these measures, a system may appear robust yet remain too fragile. Finally, we examine security, privacy, and governance risks that become acute when agents sit close to operational control surfaces. Taken together, the survey concludes that progress in intelligent NetOps and AIOps will depend on treating autonomy as a constrained operational control problem, whose outputs must be reliable, auditable, and securely deployable.
Abstract（参考訳）: 大規模な言語モデルは、インシデント調査、根本原因分析、構成合成、限定的な自己修復を含む、ネットワークオペレーション(NetOps)とITオペレーションのための人工知能(AIOps)をサポートするために、ますます使用されている。 NetOpsとAIOpsでは、このシフトがタスクの管理方法を変えています。エージェントベースのオペレーションはワークフローとして機能し、エビデンス収集からアクションを取る、パーミッション、ポリシー、チェックに従う、必要に応じてロールバックオプションを提供する。運用上の決定がすぐに影響する可能性があるため、これは非常に重要です。議論を具体化するために、自律性、ツールの範囲、証拠の痕跡、保証契約に関する関連文献を整理する。これらのコントラクトは、エージェントが観察し、提案し、実行する可能性のあるものを定義します。また、アクションが許可される前にパスしなければならないチェックを定義する。テレメトリクエリレコメンデーション、診断、根本原因分析、構成合成、変更計画、限定的な自己修復に関する作業に一貫したパターンが現れる。運用上の信頼性は,主にモデル自体からではない。それはモデルの周りの機械に依存します。また、評価は静的な質問応答を超えて行うべきだとも主張する。 Agentic NetOpsとAIOpsシステムは、トレース品質、バウンドツールの使用、安全なプロポーザル生成、サンドボックス環境でのリプレイ、ロールバックを意識したカナリアトライアルなど、ワークフロー中心の評価を必要とする。これらの措置がなければ、システムは堅牢に見えるが、脆弱すぎる。最後に、エージェントが運用管理面に近づくと、セキュリティ、プライバシ、ガバナンスのリスクが深刻になるかどうかを検討する。調査では、インテリジェントなNetOpsとAIOpsの進歩は、アウトプットの信頼性、監査性、セキュアなデプロイが求められる、制約された運用管理問題として自律性を扱うことに依存する、と結論付けている。

関連論文リスト

Securing Computer-Use Agents: A Unified Architecture-Lifecycle Framework for Deployment-Grounded Reliability [21.333731425525205]
この記事では、CUAのデプロイメント基盤信頼性のためのアーキテクチャライフサイクルフレームワークを開発する。この分析は、代表システム、ベンチマーク、およびセキュリティ/プライバシー研究を合成する。
論文参考訳（メタデータ） (2026-05-08T01:38:46Z)
Beyond the Black Box: Interpretability of Agentic AI Tool Use [0.0]
本稿では,スパースオートエンコーダと線形プローブ上に構築された機械論的・解釈可能性ツールキットを提案する。フレームワークは各アクションの前にモデル状態を読み出し、ツールが必要かどうか、そして次のツールアクションがいかに適切かの両方を推測する。我々は、NVIDIA Nemotron関数呼び出しデータセットから多段階の軌道上のプローブをトレーニングし、GPT-OSS 20BとGemma 3 27Bモデルに同じワークフローを適用する。
論文参考訳（メタデータ） (2026-05-07T19:47:30Z)
Clawed and Dangerous: Can We Trust Open Agentic Systems? [12.04979073308511]
オープンエージェントシステムは、プランニングを外部機能、永続メモリ、特権実行と組み合わせる。本稿では,6次元分析分類法を導入し,攻撃,ベンチマーク,防衛,監査,隣接技術基盤にまたがる50の論文を合成する。文献は攻撃特性とベンチマーク構築において比較的成熟しているが,デプロイメントコントロールや運用管理,永続的メモリの完全性,能力回復には依然として弱いことが,我々のレビューで示されている。
論文参考訳（メタデータ） (2026-03-27T09:45:12Z)
A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance [0.22940141855172028]
本稿では,Large Language Models (LLM) を用いたエージェントAIシステムの保証フレームワークを提案する。実行は、明示的なステップとトレースコントラクトを備えたメッセージ・アクション・トレース(MAT)として実装される。このフレームワークは、有界摂動に対する予算付き反例探索として定式化されたストレステストを含む。
論文参考訳（メタデータ） (2026-03-18T10:23:48Z)
When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making [68.12864562049957]
身体ロボットシステムは、高レベルの推論をサポートするために、大規模言語モデル(LLM)ベースのエージェントにますます依存している。エージェントはいつ、いつ、いつ行動すべきか? 本稿では,エンボディエージェントのリソース・アウェア・オーケストレーションのための階層的なフレームワークであるRARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。
論文参考訳（メタデータ） (2026-03-17T15:38:50Z)
The Why Behind the Action: Unveiling Internal Drivers via Agentic Attribution [63.61358761489141]
LLM(Large Language Model)ベースのエージェントは、カスタマーサービス、Webナビゲーション、ソフトウェアエンジニアリングといった現実世界のアプリケーションで広く使われている。本稿では,タスク結果に関係なく,エージェントの動作を駆動する内部要因を識別する,テキスト汎用エージェント属性のための新しいフレームワークを提案する。標準ツールの使用やメモリ誘起バイアスのような微妙な信頼性リスクなど、さまざまなエージェントシナリオでフレームワークを検証する。
論文参考訳（メタデータ） (2026-01-21T15:22:21Z)
CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents [60.98294016925157]
AIエージェントは、悪意のあるコンテンツがエージェントの行動をハイジャックして認証情報を盗んだり、金銭的損失を引き起こすような、インジェクション攻撃に弱い。 CUAのためのシングルショットプランニングでは、信頼できるプランナーが、潜在的に悪意のあるコンテンツを観察する前に、条件付きブランチで完全な実行グラフを生成する。このアーキテクチャ分離は命令インジェクションを効果的に防止するが、ブランチステアリング攻撃を防ぐには追加の対策が必要であることを示す。
論文参考訳（メタデータ） (2026-01-14T23:06:35Z)
DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-13T05:01:09Z)
SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文参考訳（メタデータ） (2025-03-11T17:53:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。