論文の概要: An Agentic Multi-Agent Architecture for Cybersecurity Risk Management
- arxiv url: http://arxiv.org/abs/2603.20131v2
- Date: Tue, 24 Mar 2026 22:50:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 14:25:25.885066
- Title: An Agentic Multi-Agent Architecture for Cybersecurity Risk Management
- Title(参考訳): サイバーセキュリティリスクマネジメントのためのエージェントマルチエージェントアーキテクチャ
- Authors: Ravish Gupta, Saket Kumar, Shreeya Sharma, Maulik Dang, Abhishek Aggarwal,
- Abstract要約: ほとんどの中小企業は、サイバーセキュリティのリスク評価を完全に省略している。
我々は6エージェントのAIシステムを構築し、各エージェントが1つの分析段階を処理する。
エージェントは、評価が進むにつれて成長する永続的なコンテキストを共有する。
- 参考スコア(独自算出の注目度): 0.8093437601498468
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Getting a real cybersecurity risk assessment for a small organization is expensive -- a NIST CSF-aligned engagement runs $15,000 on the low end, takes weeks, and depends on practitioners who are genuinely scarce. Most small companies skip it entirely. We built a six-agent AI system where each agent handles one analytical stage: profiling the organization, mapping assets, analyzing threats, evaluating controls, scoring risks, and generating recommendations. Agents share a persistent context that grows as the assessment proceeds, so later agents build on what earlier ones concluded -- the mechanism that distinguishes this from standard sequential agent pipelines. We tested it on a 15-person HIPAA-covered healthcare company and compared outputs to independent assessments by three CISSP practitioners -- the system agreed with them 85% of the time on severity classifications, covered 92% of identified risks, and finished in under 15 minutes. We then ran 30 repeated single-agent assessments across five synthetic but sector-realistic organizational profiles in healthcare, fintech, manufacturing, retail, and SaaS, comparing a general-purpose Mistral-7B against a domain fine-tuned model. Both completed every run. The fine-tuned model flagged threats the baseline could not see at all: PHI exposure in healthcare, OT/IIoT vulnerabilities in manufacturing, platform-specific risks in retail. The full multi-agent pipeline, however, failed every one of 30 attempts on a Tesla T4 with its 4,096-token default context window -- context capacity, not model quality, turned out to be the binding constraint.
- Abstract(参考訳): NISTのCSF対応のエンゲージメントは、ローエンドで1万5000ドル(約1100万円)、数週間かかるため、本当に不足している実践者に依存している。
ほとんどの中小企業はそれを完全にスキップしている。
エージェントが組織をプロファイリングし、資産をマッピングし、脅威を分析し、コントロールを評価し、リスクを評価し、レコメンデーションを生成する。
エージェントは、アセスメントが進むにつれて成長する永続的なコンテキストを共有するため、後続のエージェントは、それを標準的なシーケンシャルなエージェントパイプラインと区別するメカニズムである、以前のエージェントの結論に基づいて構築される。
私たちは15人のHIPAAをカバーした医療会社でテストを行い、3人のCISSP実践者によるアウトプットを独立した評価と比較しました。
次に、医療、フィンテック、製造、小売、SaaSの5つの総合的、しかしセクター的組織プロファイルに対して、汎用的なMistral-7Bとドメインの微調整モデルを比較して、30の反復的な単一エージェントアセスメントを実行しました。
いずれも毎回完走した。
微調整されたモデルでは、医療におけるPHIの暴露、製造業におけるOT/IIoTの脆弱性、小売業におけるプラットフォーム固有のリスクなど、ベースラインがまったく見えない脅威が警告された。
しかし、完全なマルチエージェントパイプラインは、デフォルトのコンテキストウィンドウ4,096で、Tesla T4の30回中1回失敗している。
関連論文リスト
- Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security? [10.248746359119625]
EVMbenchは、スマートコントラクトセキュリティに関するAIエージェントのための最初の大規模なベンチマークである。
その成果は、完全に自動化されたAI監査が到達範囲内にあるという期待を後押しした。
これらの発見は、完全に自動化されたAI監査が差し迫っているという物語に挑戦する。
論文 参考訳(メタデータ) (2026-03-11T14:07:16Z) - Why Do AI Agents Systematically Fail at Cloud Root Cause Analysis? [1.0966260566122241]
大規模なクラウドシステムの障害は、かなりの財政的損失をもたらします。
大規模言語モデル(LLM)エージェントを活用した根本原因分析(RCA)の自動化
本稿では,LCMをベースとしたRCAエージェントのプロセスレベルの故障解析について述べる。
論文 参考訳(メタデータ) (2026-02-10T16:14:05Z) - Automating Supply Chain Disruption Monitoring via an Agentic AI Approach [49.77982322940809]
我々は、自律的に監視し、分析し、拡張されたサプライネットワークにまたがる破壊に応答する、最小限の教師付きエージェントAIフレームワークを導入する。
F1スコアは0.962から0.991の間であり、破壊1回あたり0.0836ドルのコストで平均3.83分でエンドツーエンドの分析を行う。
論文 参考訳(メタデータ) (2026-01-14T18:28:31Z) - Quantifying Return on Security Controls in LLM Systems [0.0]
本稿では、残留リスクを定量化するための意思決定指向フレームワークを提案する。
敵のプローブの結果を金融リスク推定と戻り制御の指標に変換する。
論文 参考訳(メタデータ) (2025-12-17T04:58:09Z) - Penetration Testing of Agentic AI: A Comparative Security Analysis Across Models and Frameworks [0.0]
Agentic AIは、従来のLLMセーフガードが対処できないセキュリティ脆弱性を導入する。
エージェントAIシステムの最初の体系的テストと比較評価を行う。
新たな「ハロシントコンプライアンス」戦略を含む6つの防衛行動パターンを同定する。
論文 参考訳(メタデータ) (2025-12-16T19:22:50Z) - Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing [83.48116811975787]
我々は、人間のサイバーセキュリティ専門家に対するAIエージェントの包括的な評価を初めて提示する。
我々は、既存の6人のAIエージェントと、新しいエージェントの足場であるARTEMISとともに、10人のサイバーセキュリティ専門家を評価します。
ARTEMISは総合的に第2位で、9つの有効な脆弱性と82%の有効な提出率を発見した。
論文 参考訳(メタデータ) (2025-12-10T18:12:29Z) - Toward Quantitative Modeling of Cybersecurity Risks Due to AI Misuse [50.87630846876635]
我々は9つの詳細なサイバーリスクモデルを開発する。
各モデルはMITRE ATT&CKフレームワークを使用して攻撃をステップに分解する。
個々の見積もりはモンテカルロシミュレーションによって集約される。
論文 参考訳(メタデータ) (2025-12-09T17:54:17Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition [101.86739402748995]
44の現実的なデプロイメントシナリオを対象とした,22のフロンティアAIエージェントを対象にしています。
Agent Red Teamingベンチマークを構築し、19の最先端モデルで評価します。
私たちの発見は、今日のAIエージェントの重要かつ永続的な脆弱性を浮き彫りにしたものです。
論文 参考訳(メタデータ) (2025-07-28T05:13:04Z) - Tiered Agentic Oversight: A Hierarchical Multi-Agent System for Healthcare Safety [39.9193491638205]
Tiered Agentic Oversight (TAO)は階層的なマルチエージェントシステムで、階層化された自動監視を通じてAIの安全性を高める。
臨床階層(例えば、看護師-物理学者-専門医)にインスパイアされたTAOは、複雑性に基づいた専門エージェントにタスクをルーティングする。
実験によると、TAOは5つの医療安全ベンチマークのうち4つでシングルエージェントや他のマルチエージェントシステムを上回っ、最大8.2%改善されている。
論文 参考訳(メタデータ) (2025-06-14T12:46:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。