論文の概要: EnCoD: Distinguishing Compressed and Encrypted File Fragments
- arxiv url: http://arxiv.org/abs/2010.07754v1
- Date: Thu, 15 Oct 2020 13:55:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 05:20:43.747210
- Title: EnCoD: Distinguishing Compressed and Encrypted File Fragments
- Title(参考訳): encod: 圧縮および暗号化されたファイルフラグメントの識別
- Authors: Fabio De Gaspari, Dorjan Hitaj, Giulio Pagnotta, Lorenzo De Carli,
Luigi V. Mancini
- Abstract要約: 現在の手法では,大規模な断片サイズであっても,暗号化と圧縮を確実に区別することはできない。
圧縮されたデータと暗号化されたデータを確実に区別できる学習ベースの分類器であるEnCoDを,フラグメントから512バイトまで小さく設計する。
異なるデータ型の大規模なデータセットに対する現在のアプローチに対するEnCoDの評価を行い、最も検討されたフラグメントサイズやデータタイプに対して、現在の最先端よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.9239657838690228
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable identification of encrypted file fragments is a requirement for
several security applications, including ransomware detection, digital
forensics, and traffic analysis. A popular approach consists of estimating high
entropy as a proxy for randomness. However, many modern content types (e.g.
office documents, media files, etc.) are highly compressed for storage and
transmission efficiency. Compression algorithms also output high-entropy data,
thus reducing the accuracy of entropy-based encryption detectors. Over the
years, a variety of approaches have been proposed to distinguish encrypted file
fragments from high-entropy compressed fragments. However, these approaches are
typically only evaluated over a few, select data types and fragment sizes,
which makes a fair assessment of their practical applicability impossible. This
paper aims to close this gap by comparing existing statistical tests on a
large, standardized dataset. Our results show that current approaches cannot
reliably tell apart encryption and compression, even for large fragment sizes.
To address this issue, we design EnCoD, a learning-based classifier which can
reliably distinguish compressed and encrypted data, starting with fragments as
small as 512 bytes. We evaluate EnCoD against current approaches over a large
dataset of different data types, showing that it outperforms current
state-of-the-art for most considered fragment sizes and data types.
- Abstract(参考訳): 暗号化されたファイルフラグメントの信頼性の高い識別は、ランサムウェア検出、デジタル法医学、トラフィック分析など、いくつかのセキュリティアプリケーションに対する要件である。
一般的なアプローチは、ランダム性のプロキシとして高いエントロピーを推定することである。
しかし、現代の多くのコンテンツタイプ(例えば、オフィス文書、メディアファイルなど)は、ストレージと伝送効率のために高度に圧縮されている。
圧縮アルゴリズムは高エントロピーデータを出力し、エントロピーベースの暗号化検出器の精度を低下させる。
長年にわたり、暗号化されたファイルフラグメントと高エントロピー圧縮フラグメントを区別する様々なアプローチが提案されてきた。
しかしながら、これらのアプローチは通常、少数のデータ型とフラグメントサイズでのみ評価されるため、実際の適用可能性の公正な評価は不可能である。
本稿では,大規模で標準化されたデータセット上での既存の統計テストを比較することにより,このギャップを解消することを目的とする。
提案手法は, 大規模な断片サイズであっても, 暗号化と圧縮を確実に区別できないことを示す。
この問題に対処するため、我々は、圧縮されたデータと暗号化されたデータを確実に区別できる学習ベースの分類器encodを設計した。
異なるデータ型の大規模なデータセットに対する現在のアプローチに対するEnCoDの評価を行い、最も検討されたフラグメントサイズやデータタイプに対して、現在の最先端よりも優れていることを示す。
関連論文リスト
- Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Edge Storage Management Recipe with Zero-Shot Data Compression for Road
Anomaly Detection [1.4563998247782686]
本研究では,高忠実度音声を保存しながら,効率的なストレージ管理手法を提案する。
収集した高解像度オーディオをコンパクトなコードに符号化する計算ファイル圧縮手法を推奨する。
そこで本研究では,単純かつ効果的なオートエンコーダに基づくデータ圧縮手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T01:30:21Z) - Anti-Compression Contrastive Facial Forgery Detection [38.69677442287986]
圧縮レベルが異なるデータ内の密接な関係を保ち、圧縮防止のための偽造検出フレームワークを提案する。
実験結果から,提案アルゴリズムはクリーンデータ検出時の精度を向上しつつ,強い圧縮データの性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-02-13T08:34:28Z) - Unrolled Compressed Blind-Deconvolution [77.88847247301682]
sparse multi channel blind deconvolution (S-MBD) はレーダー/ソナー/超音波イメージングなどの多くの工学的応用で頻繁に発生する。
そこで本研究では,受信した全信号に対して,はるかに少ない測定値からブラインドリカバリを可能にする圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-09-28T15:16:58Z) - Dataset Condensation with Latent Space Knowledge Factorization and
Sharing [73.31614936678571]
与えられたデータセットの規則性を利用してデータセットの凝縮問題を解決する新しい手法を提案する。
データセットを元の入力空間に直接凝縮するのではなく、学習可能な一連のコードでデータセットの生成プロセスを仮定する。
提案手法は,様々なベンチマークデータセットに対して,有意なマージンで新しい最先端記録を達成できることを実験的に示す。
論文 参考訳(メタデータ) (2022-08-21T18:14:08Z) - Nearest neighbor search with compact codes: A decoder perspective [77.60612610421101]
バイナリハッシュや製品量化器などの一般的な手法を自動エンコーダとして再解釈する。
後方互換性のあるデコーダを設計し、同じ符号からベクトルの再構成を改善する。
論文 参考訳(メタデータ) (2021-12-17T15:22:28Z) - Using Convolutional Neural Networks to Detect Compression Algorithms [0.0]
ベースデータセットを使用し、さまざまなアルゴリズムですべてのファイルを圧縮し、それに基づいてモデルを設計します。
使用されるモデルは、圧縮、lzip、bzip2を使用して圧縮されたファイルを正確に識別することができた。
論文 参考訳(メタデータ) (2021-11-17T11:03:16Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Reliable Detection of Compressed and Encrypted Data [1.3439502310822147]
ランサムウェア検出、法医学、データ分析は、暗号化されたデータの断片を確実に識別する手法を必要とする。
現在のアプローチでは、エントロピー推定などのバイトレベルの分布から得られた統計を使用して、暗号化された断片を識別する。
現代のコンテンツタイプでは、データ分散を均一な分布に近づける圧縮技術を使用している。
本稿では、大規模で標準化されたデータセット上での既存の統計的テストを比較し、現在のアプローチが暗号化データと圧縮データを一貫して区別できないことを示す。
論文 参考訳(メタデータ) (2021-03-31T13:27:28Z) - Malware Traffic Classification: Evaluation of Algorithms and an
Automated Ground-truth Generation Pipeline [8.779666771357029]
地中構造データを生成するための自動パケットデータラベリングパイプラインを提案する。
この観測可能なメタデータから抽出された、ユニークで多様な機能のセットを利用する、さまざまな種類のクラスタリングアプローチを探索し、テストする。
論文 参考訳(メタデータ) (2020-10-22T11:48:51Z) - HERS: Homomorphically Encrypted Representation Search [56.87295029135185]
本稿では,暗号化ドメイン内の大規模ギャラリーに対して,プローブ(あるいはクエリ)画像表現を検索する手法を提案する。
我々の暗号方式は固定長表現の取得方法に従わないため、任意のアプリケーション領域における任意の固定長表現に適用できる。
論文 参考訳(メタデータ) (2020-03-27T01:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。