論文の概要: Reproducibility in Event-Log Research: A Parametrised Generator and Benchmark for Event-based Signatures
- arxiv url: http://arxiv.org/abs/2601.12978v1
- Date: Mon, 19 Jan 2026 11:39:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.885197
- Title: Reproducibility in Event-Log Research: A Parametrised Generator and Benchmark for Event-based Signatures
- Title(参考訳): イベントログ研究における再現性: 並列生成器とイベントベースの署名のベンチマーク
- Authors: Saad Khan, Simon Parkinson, Monika Roopak,
- Abstract要約: イベントベースのデータセットは、サイバーセキュリティ分析に不可欠である。
主要なユースケースは、複数のイベントにまたがる攻撃を表すイベントベースのシグネチャを検出することだ。
合成イベントデータセットを生成できる新しいパラメトリド生成技術を提案する。
- 参考スコア(独自算出の注目度): 2.024255109998051
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event-based datasets are crucial for cybersecurity analysis. A key use case is detecting event-based signatures, which represent attacks spanning multiple events and can only be understood once the relevant events are identified and linked. Analysing event datasets is essential for monitoring system security, but their growing volume and frequency create significant scalability and processing difficulties. Researchers rely on these datasets to develop and test techniques for automatically identifying signatures. However, because real datasets are security-sensitive and rarely shared, it becomes difficult to perform meaningful comparative evaluation between different approaches. This work addresses this evaluation limitation by offering a systematic method for generating event logs with known ground truth, enabling reproducible and comparable research. We present a novel parametrised generation technique capable of producing synthetic event datasets that contain event-based signatures for discovery. To demonstrate the capabilities of the technique, we provide a benchmark in signature detection. Our benchmarking demonstrated the suitability of DBSCAN, achieving a score greater than 0.95 Adjusted Rand Index on most generated datasets. This work enhances the ability of researchers to develop and benchmark new cybersecurity techniques, ultimately contributing to more robust and effective cybersecurity measures.
- Abstract(参考訳): イベントベースのデータセットは、サイバーセキュリティ分析に不可欠である。
主要なユースケースは、複数のイベントにまたがる攻撃を表現するイベントベースのシグネチャを検出し、関連するイベントが特定され、リンクされるとのみ理解できる。
システムセキュリティの監視には、イベントデータセットの分析が不可欠だが、その量と頻度の増加は、大幅なスケーラビリティと処理の難しさを生み出している。
研究者はこれらのデータセットを使用して、シグネチャを自動的に識別する技術を開発し、テストする。
しかし、実際のデータセットはセキュリティに敏感であり、共有されることはめったにないため、異なるアプローチ間で有意義な比較評価を行うことは困難である。
この研究は、この評価の限界に対処し、既知の土台真理でイベントログを生成する体系的な方法を提供し、再現可能で同等な研究を可能にする。
本稿では,発見のためのイベントベースシグネチャを含む合成イベントデータセットを生成可能な,新しいパラメトリド生成技術を提案する。
本手法の有効性を示すため,シグネチャ検出のベンチマークを行う。
ベンチマークではDBSCANの適合性を実証し,ほとんどのデータセットに対して0.95以上の調整ランダム指数を達成した。
この研究は、研究者が新しいサイバーセキュリティ技術を開発し、ベンチマークする能力を高め、最終的にはより堅牢で効果的なサイバーセキュリティ対策に寄与する。
関連論文リスト
- Cross-Dataset Semantic Segmentation Performance Analysis: Unifying NIST Point Cloud City Datasets for 3D Deep Learning [49.1574468325115]
本研究では、公共安全アプリケーションに関連する異種ラベル付きポイントクラウドデータセット間のセマンティックセマンティックセマンティクス性能を解析する。
主な課題は、ラベル付きデータ不足、データセット間でクラスラベルを統一することの難しさ、標準化の必要性である。
論文 参考訳(メタデータ) (2025-08-01T17:59:02Z) - ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction [57.930531826380836]
本研究は,未ラベル画像のアノテータとして画素レベルの視覚課題におけるラベル不足に,基礎的セグメンテーションモデルが対処できるかどうかを考察する。
ConformalSAMは,まず対象ドメインのラベル付きデータを用いて基礎モデルを校正し,ラベルなしデータの信頼できないピクセルラベルをフィルタリングする新しいSSSSフレームワークである。
論文 参考訳(メタデータ) (2025-07-21T17:02:57Z) - EBES: Easy Benchmarking for Event Sequences [17.277513178760348]
イベントシーケンス(英: Event Sequences、EvS)とは、不規則なサンプリング間隔と分類的特徴と数値的特徴の混合を特徴とするシーケンシャルデータである。
EBESは、シーケンスレベルのターゲットを持つEvS分類のための包括的なベンチマークである。
9つのモダンモデルを実装したオープンソースのPyTorchライブラリとともに、標準化された評価シナリオとプロトコルを備えている。
論文 参考訳(メタデータ) (2024-10-04T13:03:43Z) - Synthetic-To-Real Video Person Re-ID [57.937189569211505]
人物再識別(Re-ID)は重要な課題であり、公衆の安全と情報法医学に重要な応用がある。
本稿では、Re-IDの新規かつ挑戦的な設定、すなわちドメイン間ビデオベースの人物Re-IDについて検討する。
我々は、テストのためのトレーニングや実世界のビデオのソースドメインとして、合成ビデオデータセットを使用します。
論文 参考訳(メタデータ) (2024-02-03T10:19:21Z) - Empowering HWNs with Efficient Data Labeling: A Clustered Federated
Semi-Supervised Learning Approach [2.046985601687158]
CFL(Clustered Federated Multitask Learning)は,統計的課題を克服するための効果的な戦略として注目されている。
本稿では,より現実的なHWNシナリオ用に設計された新しいフレームワークであるClustered Federated Semi-Supervised Learning (CFSL)を紹介する。
その結果,ラベル付きデータとラベル付きデータの比率が異なる場合,CFSLはテスト精度,ラベル付け精度,ラベル付け遅延などの重要な指標を著しく改善することがわかった。
論文 参考訳(メタデータ) (2024-01-19T11:47:49Z) - A Semi-Supervised Approach for Power System Event Identification [12.862865254507179]
本稿では,既存の事象識別手法を強化するために,未ラベルの事象識別サンプルを組み込むことの有効性を評価するための,新しい半教師付きフレームワークを提案する。
提案手法は,合成事象PMUデータのモーダル解析から抽出した物理的解釈可能な特徴を用いた事象の特徴付けである。
我々は,データ生成,特徴抽出,限定ラベル付きイベント識別という3つの側面からなる包括的イベント識別パッケージを開発し,公開している。
論文 参考訳(メタデータ) (2023-09-18T19:07:41Z) - Benchmarking and Analyzing Generative Data for Visual Recognition [95.69499648941196]
この研究は生成的画像の影響を深く掘り下げ、主に外部データを利用するパラダイムを比較する。
我々は、2548のカテゴリを持つ22のデータセットからなるベンチマークである textbfGenBench を考案し、様々な視覚的認識タスクにまたがる生成データを評価した。
我々の徹底的なベンチマークと分析は、将来の調査における重要な課題を特定しながら、視覚認識における生成データの約束をスポットライトで示している。
論文 参考訳(メタデータ) (2023-07-25T17:59:59Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。
我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文 参考訳(メタデータ) (2021-10-19T17:41:43Z) - A Comprehensive Guide to CAN IDS Data & Introduction of the ROAD Dataset [1.6494191187996927]
Controller Area Networks (CAN) には基本的なセキュリティ特性がなく、簡単に利用することができる。
様々な侵入で車載CANデータを生成することは、ほとんどの研究者にとって手に入らない。
既存のオープンなCAN侵入データセットの包括的なガイドを提示する。
論文 参考訳(メタデータ) (2020-12-29T04:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。