論文の概要: A Deterministic Forensic Preprocessing Framework for Heterogeneous Network Datasets: Formal Foundations, Implementation, and Empirical Validation
- arxiv url: http://arxiv.org/abs/2606.11565v1
- Date: Wed, 10 Jun 2026 01:45:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 14:50:38.886795
- Title: A Deterministic Forensic Preprocessing Framework for Heterogeneous Network Datasets: Formal Foundations, Implementation, and Empirical Validation
- Title(参考訳): 不均一なネットワークデータセットのための決定論的Forensic Preprocessing Framework:形式的基礎,実装,実証的検証
- Authors: Ravi Chaudhary, Reza Ryan, Nasim Ferdosian, Nickson M. Karie, Qian Li,
- Abstract要約: 本稿では、異種ネットワークデータセットを再現可能な標準形式に変換する決定論的法科学前処理フレームワークを提案する。
チャンクベースのアーキテクチャは、O(c)境界メモリを提供する。
UNSW-NB15、IoT-23、TON_IoTにわたる実証的な評価は、繰り返し実行される実行における100%の出力一貫性を示している。
- 参考スコア(独自算出の注目度): 3.861495812647291
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital forensic investigations increasingly depend on preprocessing heterogeneous network evidence from intrusion detection systems, IoT devices, and enterprise traffic logs. Incompatible schemas and timestamp formats hinder evidence correlation and timeline reconstruction, while current ad hoc approaches offer no mechanism to verify consistency across runs or analysis, creating reproducibility gaps that challenge evidence admissibility. This paper introduces a deterministic forensic preprocessing framework that converts heterogeneous network datasets into a reproducible canonical form. The framework formalises three preprocessing transformations: schema normalisation, temporal normalisation, and provenance tracking. These transformations are specified using set-theoretic definitions and supported by four theorems establishing determinism, information preservation, and provenance completeness. A chunk-based architecture provides O(c) bounded memory. Empirical evaluation across UNSW-NB15, IoT-23, and TON_IoT demonstrates 100% output consistency across repeated runs, robust temporal normalisation completeness over heterogeneous timestamp formats, and scalable performance from millions to hundreds of millions of records.
- Abstract(参考訳): デジタル法医学的な調査は、侵入検知システム、IoTデバイス、エンタープライズトラフィックログからの異種ネットワーク証拠の事前処理にますます依存している。
互換性のないスキーマやタイムスタンプフォーマットはエビデンス相関やタイムラインの再構築を妨げるが、現在のアドホックアプローチでは実行時や解析時の一貫性を検証できないため、エビデンスの許容性に異議を唱える再現性ギャップが生じる。
本稿では、異種ネットワークデータセットを再現可能な標準形式に変換する決定論的法科学前処理フレームワークを提案する。
このフレームワークはスキーマ正規化、時間正規化、前処理追跡という3つの前処理変換を形式化している。
これらの変換は集合論的定義を用いて定義され、決定論、情報保存、証明完全性を確立する4つの定理によって支持される。
チャンクベースのアーキテクチャは、O(c)境界メモリを提供する。
UNSW-NB15、IoT-23、TON_IoTにわたる実証的な評価は、繰り返し実行される実行における100%の出力一貫性、異種タイムスタンプフォーマットに対する堅牢な時間正規化完全性、数百万から数億レコードまでのスケーラブルなパフォーマンスを示している。
関連論文リスト
- REGEN: Reference-Guided Synthetic Multivariate Time Series Generation for Forecasting [7.771378647684901]
本稿では,観測された配列を合成のための構造的足場として扱う参照誘導型生成パイプラインを提案する。
ReGeNの生成したデータは、最小限の予測劣化を伴う実兄弟データに一貫した代用であることを示す。
これは、低データのレシエーションにおいて、参照データが構造的に悪用される方法が、利用可能なデータ量と同じくらい重要であることを示唆している。
論文 参考訳(メタデータ) (2026-06-03T16:19:55Z) - AnchorMoE: Interpretable Time Series Classification via Anchor-Routed MoE [51.994752158953084]
AnchorMoEは、解釈可能な構成別分類フレームワークである。
ローカルパッチのマルチビュー表現をエンコードし、専門の専門家にルーティングする。
実世界のベンチマークと合成ベンチマークの実験は、AnchorMoEが非常に競争力のある分類性能を達成することを示した。
論文 参考訳(メタデータ) (2026-06-02T13:30:54Z) - Monitoring Data-aware Temporal Properties (Extended Version) [56.386411908764494]
有限トレース上の任意のSMT理論に富む線形時間特性の予測モニタリングについて考察する。
この設定での予測モニタリングは非常に困難であり、監視状態はこれまでのトレースプレフィックスと可能な有限継続の両方に依存している。
本研究は,表現的フラグメントオフMTにおける特性モニタリングのための新しい基礎的枠組みの正しさを提示し,正式に証明するものである。
論文 参考訳(メタデータ) (2026-05-14T10:23:11Z) - Conditional Attribution for Root Cause Analysis in Time-Series Anomaly Detection [13.555771273974697]
本稿では,文脈的に類似したシステム状態に対する異常を記述した条件属性フレームワークを提案する。
本手法は,異常観測を条件とした代表例を検索し,依存関係の保存と運用上の意味のある説明を可能にする。
SWaTとベンチマークの実験により、提案手法は複数の異常検出モデルにおける根本原因同定精度、時間的局所化、ロバスト性を一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-04-19T21:01:52Z) - LEFT: Learnable Fusion of Tri-view Tokens for Unsupervised Time Series Anomaly Detection [53.191369031661885]
教師なし時系列異常検出は、アノテーションの可用性を前提とせず、異常なタイムスタンプを識別するモデルを構築することを目的としている。
本稿では,非教師付きTSADフレームワークであるLearnable Fusion of Tri-view Tokens(LEFT)について述べる。
実世界のベンチマーク実験では、LEFTはSOTAベースラインに対して最高の検出精度を示し、FLOPの5倍、トレーニングの8倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2026-02-09T13:33:49Z) - On the Identifiability of Regime-Switching Models with Multi-Lag Dependencies [42.274922469778545]
マルチラグレジームスイッチングモデル(RSM)の一般的な理論的枠組みを開発する。
非線形ガウス条件下では,レギュラー数とマルチラグ遷移の双方の識別可能性を示す。
我々の結果は、アーキテクチャとノイズの仮定を通して完全に教師なしの設定を保ちます。
論文 参考訳(メタデータ) (2026-01-06T15:12:39Z) - UniDiff: A Unified Diffusion Framework for Multimodal Time Series Forecasting [90.47915032778366]
マルチモーダル時系列予測のための統合拡散フレームワークUniDiffを提案する。
コアには統一的で並列な融合モジュールがあり、単一のクロスアテンション機構がタイムスタンプからの構造化情報とテキストからのセマンティックコンテキストを統合する。
8つの領域にわたる実世界のベンチマークデータセットの実験は、提案したUniDiffモデルが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-12-08T05:36:14Z) - Continuous Wavelet Transform and Siamese Network-Based Anomaly Detection in Multi-variate Semiconductor Process Time Series [0.11184789007828977]
半導体製造における異常予測には いくつか重要な課題があります
本稿では,機械学習を用いたMTSデータにおける異常検出のための新しい汎用的アプローチを提案する。
提案手法は,実FABプロセスの時系列データセット上で異常を識別する際の精度が高いことを示す。
論文 参考訳(メタデータ) (2025-07-01T11:10:19Z) - Multivariate Long-term Time Series Forecasting with Fourier Neural Filter [42.60778405812048]
我々はFNFをバックボーンとして、DBDをアーキテクチャとして導入し、空間時間モデルのための優れた学習能力と最適な学習経路を提供する。
FNFは、局所時間領域とグローバル周波数領域の情報処理を単一のバックボーン内で統合し、空間的モデリングに自然に拡張することを示す。
論文 参考訳(メタデータ) (2025-06-10T18:40:20Z) - GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models [0.08192907805418582]
デジタル法医学とインシデント応答(DFIR)におけるサイバータイムライン解析の重要性
伝統的な手法は、証拠の識別と特徴抽出のためにログやメタデータのような構造化された成果物に依存している。
本稿では,大規模言語モデル(LLM)を利用したフレームワークであるGenDFIR,特にゼロショットモードのLlama 3.1 8Bについて紹介し,Retrieval-Augmented Generation (RAG)エージェントと統合する。
論文 参考訳(メタデータ) (2024-09-04T09:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。