論文の概要: LLM-driven Provenance Forensics for Threat Investigation and Detection
- arxiv url: http://arxiv.org/abs/2508.21323v1
- Date: Fri, 29 Aug 2025 04:39:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:10.925114
- Title: LLM-driven Provenance Forensics for Threat Investigation and Detection
- Title(参考訳): LLMによる脅威調査・検出のための危険予知法
- Authors: Kunal Mukherjee, Murat Kantarcioglu,
- Abstract要約: PROVSEEKは、証明駆動の法医学的分析と脅威情報抽出のためのエージェントフレームワークである。
ベクター化された脅威レポートの知識ベースとシステム前駆者データベースのデータとを融合させる、正確なコンテキスト対応クエリを生成する。
証明クエリを解決し、複数の役割特異的なエージェントを編成して幻覚を緩和し、構造化された、地味で検証可能な法医学的な要約を合成する。
- 参考スコア(独自算出の注目度): 12.388936704058521
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce PROVSEEK, an LLM-powered agentic framework for automated provenance-driven forensic analysis and threat intelligence extraction. PROVSEEK employs specialized toolchains to dynamically retrieve relevant context by generating precise, context-aware queries that fuse a vectorized threat report knowledge base with data from system provenance databases. The framework resolves provenance queries, orchestrates multiple role-specific agents to mitigate hallucinations, and synthesizes structured, ground-truth verifiable forensic summaries. By combining agent orchestration with Retrieval-Augmented Generation (RAG) and chain-of-thought (CoT) reasoning, PROVSEEK enables adaptive multi-step analysis that iteratively refines hypotheses, verifies supporting evidence, and produces scalable, interpretable forensic explanations of attack behaviors. By combining provenance data with agentic reasoning, PROVSEEK establishes a new paradigm for grounded agentic forecics to investigate APTs. We conduct a comprehensive evaluation on publicly available DARPA datasets, demonstrating that PROVSEEK outperforms retrieval-based methods for intelligence extraction task, achieving a 34% improvement in contextual precision/recall; and for threat detection task, PROVSEEK achieves 22%/29% higher precision/recall compared to both a baseline agentic AI approach and State-Of-The-Art (SOTA) Provenance-based Intrusion Detection System (PIDS).
- Abstract(参考訳): 本稿では,LLMによる自動鑑定分析と脅威情報抽出のためのエージェントフレームワークであるPROVSEEKを紹介する。
PROVSEEKは、ベクター化された脅威レポート知識ベースとシステム前駆者データベースのデータとを融合させる、正確なコンテキスト対応クエリを生成することで、関連するコンテキストを動的に取得するために、特殊なツールチェーンを使用している。
このフレームワークは、前駆的なクエリを解決し、幻覚を緩和するために複数の役割特異的なエージェントを編成し、構造化された、地味で検証可能な法医学的な要約を合成する。
ProVSEEKは、エージェントオーケストレーションとRetrieval-Augmented Generation(RAG)とチェーン・オブ・プリート(CoT)推論を組み合わせることで、仮説を反復的に洗練し、証拠を検証し、攻撃行動のスケーラブルで解釈可能な法医学的説明を生成する、適応的な多段階分析を可能にする。
ProVSEEKはエージェント推論と前駆体データを組み合わせることで、APTを調査するための接地されたエージェントの生態学の新しいパラダイムを確立する。
ProVSEEKは汎用のDARPAデータセットに対して総合的な評価を行い、インテリジェンス抽出タスクにおいて34%の精度向上を実現し、脅威検出タスクでは22%/29%の高精度/リコールを実現し、ベースラインのエージェントAIアプローチとステートオフ・ザ・アート(SOTA) Provenance-based Intrusion Detection System(PIDS)の両方と比較した。
関連論文リスト
- Propose and Rectify: A Forensics-Driven MLLM Framework for Image Manipulation Localization [49.71303998618939]
本稿では,意味論的推論と法科学的な分析を橋渡しするPropose-Rectifyフレームワークを提案する。
提案手法は,具体的技術実証により,初期セマンティックな提案が体系的に検証され,拡張されることを保証し,包括的検出精度と局所化精度を実現する。
論文 参考訳(メタデータ) (2025-08-25T12:43:53Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - Deep Research Agents: A Systematic Examination And Roadmap [79.04813794804377]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - AURA: A Multi-Agent Intelligence Framework for Knowledge-Enhanced Cyber Threat Attribution [3.6586145148601594]
AURA(Attribution Using Retrieval-Augmented Agents)は、APT属性の自動化と解釈のための知識強化フレームワークである。
AURAはTactics, Techniques, and procedures (TTPs)、Indicators of Compromise (IoCs)、マルウェアの詳細、敵対ツール、時間情報など様々な脅威データを取り込みます。
論文 参考訳(メタデータ) (2025-06-11T21:00:51Z) - MA-RAG: Multi-Agent Retrieval-Augmented Generation via Collaborative Chain-of-Thought Reasoning [43.66966457772646]
MA-RAGは、タスク認識推論でRAGパイプラインの各ステージに取り組むために、特別なAIエージェントの協力的なセットを編成する。
我々の設計では、モデルが微調整されることなく、情報の流れをきめ細かな制御が可能である。
このモジュラーおよび推論駆動アーキテクチャにより、MA-RAGは堅牢で解釈可能な結果を提供できる。
論文 参考訳(メタデータ) (2025-05-26T15:05:18Z) - InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation [63.55258191625131]
InfoDeepSeekは、現実世界の動的Web環境でエージェント情報を求めるための新しいベンチマークである。
本稿では,決定性,難易度,多様性の基準を満たす課題クエリを構築するための体系的手法を提案する。
本研究では,情報探索結果の正確性,有用性,コンパクト性に関する詳細な指標を含む,動的エージェント情報探索に適した最初の評価フレームワークを開発する。
論文 参考訳(メタデータ) (2025-05-21T14:44:40Z) - Cybersecurity threat detection based on a UEBA framework using Deep Autoencoders [0.0]
本稿では,UEBAに基づく異常検出フレームワークの最初の実装について紹介する。
ニューラルネットワークの理論的基礎に基づいて、完全連結ニューラルネットワークに対する2つの広く使われている定義の等価性を示す新しい証明を提供する。
提案するUEBAフレームワークは,企業環境にシームレスに統合可能であることが示唆された。
論文 参考訳(メタデータ) (2025-05-14T13:18:12Z) - Exploring Answer Set Programming for Provenance Graph-Based Cyber Threat Detection: A Novel Approach [4.302577059401172]
プロヴァンスグラフは、サイバーセキュリティにおけるシステムレベルのアクティビティを表現するのに有用なツールである。
本稿では, ASP を用いてプロファイランスグラフをモデル化・解析する手法を提案する。
論文 参考訳(メタデータ) (2025-01-24T14:57:27Z) - GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models [0.08192907805418582]
デジタル法医学とインシデント応答(DFIR)におけるサイバータイムライン解析の重要性
伝統的な手法は、証拠の識別と特徴抽出のためにログやメタデータのような構造化された成果物に依存している。
本稿では,大規模言語モデル(LLM)を利用したフレームワークであるGenDFIR,特にゼロショットモードのLlama 3.1 8Bについて紹介し,Retrieval-Augmented Generation (RAG)エージェントと統合する。
論文 参考訳(メタデータ) (2024-09-04T09:46:33Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。