Fugu-MT 論文翻訳(概要): GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models

論文の概要: GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models

arxiv url: http://arxiv.org/abs/2409.02572v4
Date: Fri, 27 Dec 2024 13:29:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-30 21:44:04.825816
Title: GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models
Title（参考訳）: GenDFIR:Retrieval Augmented Generationと大規模言語モデルによるサイバーインシデントタイムライン解析の強化
Authors: Fatma Yasmine Loumachi, Mohamed Chahine Ghanem, Mohamed Amine Ferrag,
Abstract要約: デジタル法医学とインシデント応答(DFIR)におけるサイバータイムライン解析の重要性伝統的な手法は、証拠の識別と特徴抽出のためにログやメタデータのような構造化された成果物に依存している。本稿では,大規模言語モデル(LLM)を利用したフレームワークであるGenDFIR,特にゼロショットモードのLlama 3.1 8Bについて紹介し,Retrieval-Augmented Generation (RAG)エージェントと統合する。
参考スコア（独自算出の注目度）: 0.08192907805418582
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Cyber timeline analysis, or forensic timeline analysis, is crucial in Digital Forensics and Incident Response (DFIR). It examines artefacts and events particularly timestamps and metadata to detect anomalies, establish correlations, and reconstruct incident timelines. Traditional methods rely on structured artefacts, such as logs and filesystem metadata, using specialised tools for evidence identification and feature extraction. This paper introduces GenDFIR, a framework leveraging large language models (LLMs), specifically Llama 3.1 8B in zero shot mode, integrated with a Retrieval-Augmented Generation (RAG) agent. Incident data is preprocessed into a structured knowledge base, enabling the RAG agent to retrieve relevant events based on user prompts. The LLM interprets this context, offering semantic enrichment. Tested on synthetic data in a controlled environment, results demonstrate GenDFIR's reliability and robustness, showcasing LLMs potential to automate timeline analysis and advance threat detection.
Abstract（参考訳）: サイバー・タイムライン分析(サイバー・タイムライン・アナリティクス、英: Cyber timeline analysis)は、デジタル・フォサイシクスとインシデント・レスポンス(DFIR)において重要である。アーティファクトやイベント、特にタイムスタンプやメタデータを調べ、異常を検出し、相関を確立し、インシデントタイムラインを再構築する。従来の手法はログやファイルシステムのメタデータといった構造化された成果物に依存しており、証拠の特定と特徴抽出のための特別なツールを使用する。本稿では,大規模言語モデル(LLM)を利用したフレームワークであるGenDFIR,特にゼロショットモードのLlama 3.1 8Bについて紹介し,Retrieval-Augmented Generation (RAG)エージェントと統合する。インシデントデータを構造化知識ベースに前処理し、RAGエージェントがユーザプロンプトに基づいて関連するイベントを検索できるようにする。 LLMはこの文脈を解釈し、セマンティックエンリッチメントを提供する。制御された環境下での合成データを用いて実験を行い,GenDFIRの信頼性とロバスト性を示し,時系列解析の自動化と脅威検出の進展を示す。

関連論文リスト

Identity Card Presentation Attack Detection: A Systematic Review [7.7489419818764596]
ディープ・ラーニングはプレゼンテーション・アタック検出の進歩を推進した。この分野は、データの欠如とモデルの一般化の貧弱により、基本的に制限されている。本稿では,本研究の成果を整理し,重要な研究ギャップを特定し,今後の研究の規範的ロードマップを概説する。
論文参考訳（メタデータ） (2025-11-08T15:55:37Z)
TS-Agent: A Time Series Reasoning Agent with Iterative Statistical Insight Gathering [16.95452463476229]
大規模言語モデル(LLM)のための時系列推論エージェントTS-Agentを提案する。時系列をテキストトークン、画像、埋め込みにマッピングする代わりに、我々のエージェントは原子演算子を介して生の数値列と相互作用する。実験の結果,TS-Agent は理解ベンチマークの最先端 LLM に匹敵する性能を達成できた。
論文参考訳（メタデータ） (2025-10-08T18:31:53Z)
LLM-driven Provenance Forensics for Threat Investigation and Detection [12.388936704058521]
PROVSEEKは、証明駆動の法医学的分析と脅威情報抽出のためのエージェントフレームワークである。ベクター化された脅威レポートの知識ベースとシステム前駆者データベースのデータとを融合させる、正確なコンテキスト対応クエリを生成する。証明クエリを解決し、複数の役割特異的なエージェントを編成して幻覚を緩和し、構造化された、地味で検証可能な法医学的な要約を合成する。
論文参考訳（メタデータ） (2025-08-29T04:39:52Z)
Enabling Transparent Cyber Threat Intelligence Combining Large Language Models and Domain Ontologies [3.4423725226938426]
ログからの情報抽出の精度と説明性を向上するAIエージェントを構築するための新しい手法を提案する。本手法の設計は,ハニーポットデータに関連する解析的要件によって動機付けられている。その結果,従来のプロンプトのみの手法に比べて,情報抽出の精度が高いことがわかった。
論文参考訳（メタデータ） (2025-08-26T23:17:33Z)
Time-RA: Towards Time Series Reasoning for Anomaly with LLM Feedback [55.284574165467525]
Time-RA(Time-Series Reasoning for Anomaly)は、時系列異常検出を生成的、推論集約的なタスクに変換する。また,実世界のマルチモーダルベンチマークデータセットであるRATs40Kを導入する。
論文参考訳（メタデータ） (2025-07-20T18:02:50Z)
Respecting Temporal-Causal Consistency: Entity-Event Knowledge Graphs for Retrieval-Augmented Generation [69.45495166424642]
我々は,物語文書における時間的,因果的,文字的整合性を理解するために,頑健で差別的なQAベンチマークを開発する。次に、バイナリマッピングでリンクされたエンティティとイベントのサブグラフを分離したまま保持するデュアルグラフフレームワークであるEntity-Event RAG(E2RAG)を紹介します。 ChronoQA全体で、我々のアプローチは最先端の非構造化およびKGベースのRAGベースラインよりも優れており、因果一貫性クエリや文字整合性クエリが顕著である。
論文参考訳（メタデータ） (2025-06-06T10:07:21Z)
Deepfake Forensic Analysis: Source Dataset Attribution and Legal Implications of Synthetic Media Manipulation [5.764826667785188]
Generative Adrial Networks (GANs) が生成する合成メディアは、認証の検証とデータセットの起源のトレースに課題を提起する。本稿では,GAN生成画像のトレーニングデータセット(例えば CelebA や FFHQ)を解釈可能な特徴解析により識別する新しい法医学的枠組みを提案する。
論文参考訳（メタデータ） (2025-05-16T10:47:18Z)
Forecasting from Clinical Textual Time Series: Adaptations of the Encoder and Decoder Language Model Families [6.882042556551609]
本稿では, タイムスタンプによる臨床所見が予測の主入力となるテキスト時系列からの予測問題について紹介する。我々は、細調整されたデコーダベースの大規模言語モデルやエンコーダベースのトランスフォーマーなど、多様なモデル群を評価する。
論文参考訳（メタデータ） (2025-04-14T15:48:56Z)
See it, Think it, Sorted: Large Multimodal Models are Few-shot Time Series Anomaly Analyzers [23.701716999879636]
時系列データの急激な増加に伴い,時系列異常検出(TSAD)はますます重要になりつつある。本稿では,TMA(Time Series Anomaly Multimodal Analyzer)と呼ばれる先駆的なフレームワークを導入し,異常の検出と解釈を両立させる。
論文参考訳（メタデータ） (2024-11-04T10:28:41Z)
Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文参考訳（メタデータ） (2024-10-09T06:26:39Z)
Metadata Matters for Time Series: Informative Forecasting with Transformers [70.38241681764738]
時系列予測のためのMetaTST(Metadata-informed Time Series Transformer)を提案する。メタデータの非構造化の性質に取り組むため、MetaTSTは、事前に設計されたテンプレートによってそれらを自然言語に形式化する。 Transformerエンコーダは、メタデータ情報によるシーケンス表現を拡張するシリーズトークンとメタデータトークンの通信に使用される。
論文参考訳（メタデータ） (2024-10-04T11:37:55Z)
Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できるこの研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文参考訳（メタデータ） (2024-07-17T20:01:21Z)
State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.279784235147254]
このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。新たなイメージは、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを考える余地があることを示唆している。
論文参考訳（メタデータ） (2024-06-13T12:51:22Z)
PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文参考訳（メタデータ） (2024-06-04T13:51:08Z)
Can Foundational Large Language Models Assist with Conducting Pharmaceuticals Manufacturing Investigations? [0.0]
我々は、特定のユースケース、医薬品製造調査に焦点をあてる。本稿では, 製造事故や逸脱の歴史的記録を活用することで, 新規事例に対処し, 閉鎖する上で有益であることが示唆された。そこで本研究では, ベクトル埋め込みによる差分記述のセマンティック検索により, 類似した記録を同定できることを示す。
論文参考訳（メタデータ） (2024-04-24T00:56:22Z)
System for systematic literature review using multiple AI agents: Concept and an empirical evaluation [5.194208843843004]
本稿では,システム文献レビューの実施プロセスの完全自動化を目的とした,新しいマルチAIエージェントモデルを提案する。このモデルは、研究者がトピックを入力するユーザフレンドリーなインターフェースを介して動作する。関連する学術論文を検索するために使用される検索文字列を生成する。モデルはこれらの論文の要約を自律的に要約する。
論文参考訳（メタデータ） (2024-03-13T10:27:52Z)
Characterization of Large Language Model Development in the Datacenter [55.9909258342639]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文参考訳（メタデータ） (2024-03-12T13:31:14Z)
Position: What Can Large Language Models Tell Us about Time Series Analysis [69.70906014827547]
現在の大規模言語モデル(LLM)は時系列解析に革命をもたらす可能性があると我々は主張する。このような進歩は、時系列のモダリティスイッチングや質問応答など、幅広い可能性を解き放つ可能性がある。
論文参考訳（メタデータ） (2024-02-05T04:17:49Z)
It Is Time To Steer: A Scalable Framework for Analysis-driven Attack Graph Generation [50.06412862964449]
アタックグラフ(AG)は、コンピュータネットワークに対するマルチステップ攻撃に対するサイバーリスクアセスメントをサポートする最も適したソリューションである。現在の解決策は、アルゴリズムの観点から生成問題に対処し、生成が完了した後のみ解析を仮定することである。本稿では,アナリストがいつでもシステムに問い合わせることのできる新しいワークフローを通じて,従来のAG分析を再考する。
論文参考訳（メタデータ） (2023-12-27T10:44:58Z)
AART: AI-Assisted Red-Teaming with Diverse Data Generation for New LLM-powered Applications [5.465142671132731]
大規模言語モデル(LLM)のアドバイザリテストは、安全で責任のあるデプロイメントに不可欠である。本稿では,新しい下流アプリケーション上でのLCM生成の安全性をテストするために,逆評価データセットの自動生成のための新しいアプローチを提案する。 AI支援のレッドチーム(AART)と呼ばれています。
論文参考訳（メタデータ） (2023-11-14T23:28:23Z)
A Comprehensive Analysis of the Role of Artificial Intelligence and Machine Learning in Modern Digital Forensics and Incident Response [0.0]
目標は、デジタル法医学とインシデント対応において、AIとMLのテクニックがどのように使われているか、詳しく調べることである。この取り組みは、AI駆動の方法論がこれらの重要なデジタル法医学の実践を形作っている複雑な方法を明らかにするために、表面のずっと下を掘り下げる。最終的に、この論文は、デジタル法医学におけるAIとMLの統合の重要性を強調し、現代のサイバー脅威に取り組む上での、彼らのメリット、欠点、より広範な意味についての洞察を提供する。
論文参考訳（メタデータ） (2023-09-13T16:23:53Z)
TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文参考訳（メタデータ） (2023-05-19T10:11:21Z)
RESAM: Requirements Elicitation and Specification for Deep-Learning Anomaly Models with Applications to UAV Flight Controllers [24.033936757739617]
ドメインの専門家やディスカッションフォーラム、公式な製品ドキュメントから知識を統合化するための要件プロセスであるRESAMを紹介します。本稿では,小型無人航空システムのための飛行制御システムに基づくケーススタディを提案し,その利用が効果的な異常検出モデルの構築を導くことを実証する。
論文参考訳（メタデータ） (2022-07-18T18:09:59Z)
A Review of Open Source Software Tools for Time Series Analysis [0.0]
本稿では、アーキテクチャを備えた典型的な時系列分析(TSA)フレームワークについて述べ、TSAフレームワークの主な特徴を列挙する。本稿では,60の時系列解析ツール,32の予測モジュール,21のパッケージの異常検出について検討した。
論文参考訳（メタデータ） (2022-03-10T07:12:20Z)
Anomaly Detection for Aggregated Data Using Multi-Graph Autoencoder [21.81622481466591]
システムログの異常検出モデルの作成に重点を置いている。集約されたデータと集約されたイベント間の関係を徹底的に分析する。本稿では,新しい畳み込みグラフ自動エンコーダモデルMGAEを提案する。
論文参考訳（メタデータ） (2021-01-11T17:38:42Z)
Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文参考訳（メタデータ） (2020-12-04T19:21:37Z)
A Causal-based Framework for Multimodal Multivariate Time Series Validation Enhanced by Unsupervised Deep Learning as an Enabler for Industry 4.0 [0.0]
マルチレベルコンテキスト異常検出のための概念検証フレームワークを開発した。長期記憶オートエンコーダの評価を成功させ、高炉の複数の資産に関連する文脈の学習された表現を検証する。プロセス産業に適用された非教師なし根本原因分析の実現手段として、因果発見と表現学習を組み合わせた研究ロードマップが特定されている。
論文参考訳（メタデータ） (2020-08-05T14:48:02Z)
Meta-learning framework with applications to zero-shot time-series forecasting [82.61728230984099]
この研究は幅広いメタラーニングフレームワークを使って肯定的な証拠を提供する。残余接続はメタラーニング適応機構として機能する。我々は、ソースTSデータセット上でニューラルネットワークをトレーニングし、異なるターゲットTSデータセット上で再トレーニングすることなくデプロイできることを示します。
論文参考訳（メタデータ） (2020-02-07T16:39:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。