論文の概要: PicoDomain: A Compact High-Fidelity Cybersecurity Dataset
- arxiv url: http://arxiv.org/abs/2008.09192v1
- Date: Thu, 20 Aug 2020 20:18:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 04:17:49.556045
- Title: PicoDomain: A Compact High-Fidelity Cybersecurity Dataset
- Title(参考訳): PicoDomain: コンパクトな高忠実なサイバーセキュリティデータセット
- Authors: Craig Laprade, Benjamin Bowman, H. Howie Huang
- Abstract要約: 現在のサイバーセキュリティデータセットは、根拠のない真実を提供するか、匿名化されたデータでそれを行う。
既存のデータセットのほとんどは、プロトタイプ開発中に扱いにくいほどの大きさです。
本稿では,現実的な侵入から得られたZeekログのコンパクトな高忠実度収集であるPicoDomainデータセットを開発した。
- 参考スコア(独自算出の注目度): 0.9281671380673305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Analysis of cyber relevant data has become an area of increasing focus. As
larger percentages of businesses and governments begin to understand the
implications of cyberattacks, the impetus for better cybersecurity solutions
has increased. Unfortunately, current cybersecurity datasets either offer no
ground truth or do so with anonymized data. The former leads to a quandary when
verifying results and the latter can remove valuable information. Additionally,
most existing datasets are large enough to make them unwieldy during prototype
development. In this paper we have developed the PicoDomain dataset, a compact
high-fidelity collection of Zeek logs from a realistic intrusion using relevant
Tools, Techniques, and Procedures. While simulated on a small-scale network,
this dataset consists of traffic typical of an enterprise network, which can be
utilized for rapid validation and iterative development of analytics platforms.
We have validated this dataset using traditional statistical analysis and
off-the-shelf Machine Learning techniques.
- Abstract(参考訳): サイバー関連データの分析は、注目が集まっている分野となっている。
企業や政府がサイバー攻撃の意義を理解し始めるにつれて、より優れたサイバーセキュリティソリューションへの衝動が高まっている。
残念ながら、現在のサイバーセキュリティデータセットは、根拠のない真実を提供していないか、匿名化されたデータでそれを行う。
前者は結果を検証するとき、後者は貴重な情報を除去することができる。
さらに、既存のデータセットの多くは、プロトタイプ開発時に不利になるほど大きい。
本稿では,関連ツール,テクニック,手順を用いて,現実的な侵入から得られたZeekログのコンパクトな高忠実度コレクションであるPicoDomainデータセットを開発した。
このデータセットは小規模なネットワーク上でシミュレートされるが、エンタープライズネットワークの典型的なトラフィックで構成されており、分析プラットフォームの迅速な検証と反復的な開発に利用できる。
従来の統計分析とオフザシェルフ機械学習技術を用いて,このデータセットを検証する。
関連論文リスト
- On the Cross-Dataset Generalization of Machine Learning for Network
Intrusion Detection [50.38534263407915]
ネットワーク侵入検知システム(NIDS)はサイバーセキュリティの基本的なツールである。
多様なネットワークにまたがる一般化能力は、その有効性と現実のアプリケーションにとって必須の要素である。
本研究では,機械学習に基づくNIDSの一般化に関する包括的分析を行う。
論文 参考訳(メタデータ) (2024-02-15T14:39:58Z) - TII-SSRC-23 Dataset: Typological Exploration of Diverse Traffic Patterns
for Intrusion Detection [0.5261718469769447]
既存のデータセットは、しばしば不足しており、必要な多様性と現在のネットワーク環境との整合性が欠如している。
本稿では,これらの課題を克服するための新しい包括的データセットであるTII-SSRC-23を紹介する。
論文 参考訳(メタデータ) (2023-09-14T05:23:36Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Graph Mining for Cybersecurity: A Survey [61.505995908021525]
マルウェア、スパム、侵入などのサイバー攻撃の爆発的な増加は、社会に深刻な影響をもたらした。
従来の機械学習(ML)ベースの手法は、サイバー脅威の検出に広く用いられているが、現実のサイバーエンティティ間の相関をモデル化することはほとんどない。
グラフマイニング技術の普及に伴い、サイバーエンティティ間の相関を捉え、高いパフォーマンスを達成するために、多くの研究者がこれらの手法を調査した。
論文 参考訳(メタデータ) (2023-04-02T08:43:03Z) - Enabling Inter-organizational Analytics in Business Networks Through
Meta Machine Learning [0.0]
センシティブな情報を開示すると同時に、交換が必要なデータの量の多さが、効果的なシステムワイドソリューションの創出の鍵となるインヒビターである。
本稿では,これらの障害に対処し,ビジネスネットワーク内の包括的分析を可能にするメタ機械学習手法を提案する。
論文 参考訳(メタデータ) (2023-03-28T09:06:28Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Privacy-preserving machine learning with tensor networks [50.591267188664666]
テンソルネットワークアーキテクチャは、特にプライバシー保護機械学習に期待できる特性を持つことを示す。
まず、フィードフォワードニューラルネットワークに存在する新たなプライバシ脆弱性を説明し、それを合成および実世界のデータセットで説明する。
このような条件がテンソルネットワークアーキテクチャによって満たされていることを厳密に証明する。
論文 参考訳(メタデータ) (2022-02-24T19:04:35Z) - A Review of Topological Data Analysis for Cybersecurity [1.0878040851638]
トポロジカルデータ解析(TDA)は、代数的トポロジの技法を用いて、データの高レベル構造を研究する。
我々は、サイバーセキュリティデータサイエンスを改善する強力な可能性を持つ、有望な新しい領域について、研究者に強調したい。
論文 参考訳(メタデータ) (2022-02-16T13:03:52Z) - Occams Razor for Big Data? On Detecting Quality in Large Unstructured
Datasets [0.0]
分析複雑性への新たな傾向は、科学におけるパシモニーやオッカム・ラザーの原理にとって深刻な課題である。
データクラスタリングのための計算的ビルディングブロックアプローチは、最小の計算時間で大規模な非構造化データセットを扱うのに役立つ。
このレビューは、東西の文化的な違いがビッグデータ分析の過程にどのように影響するかを結論付けている。
論文 参考訳(メタデータ) (2020-11-12T16:06:01Z) - Privacy-preserving Traffic Flow Prediction: A Federated Learning
Approach [61.64006416975458]
本稿では,フェデレート学習に基づくGated Recurrent Unit Neural Network Algorithm (FedGRU) というプライバシ保護機械学習手法を提案する。
FedGRUは、現在の集中学習方法と異なり、安全なパラメータアグリゲーション機構を通じて、普遍的な学習モデルを更新する。
FedGRUの予測精度は、先進的なディープラーニングモデルよりも90.96%高い。
論文 参考訳(メタデータ) (2020-03-19T13:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。