論文の概要: Transformer-Boosted Anomaly Detection with Fuzzy Hashes
- arxiv url: http://arxiv.org/abs/2208.11367v1
- Date: Wed, 24 Aug 2022 08:26:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 13:27:11.051631
- Title: Transformer-Boosted Anomaly Detection with Fuzzy Hashes
- Title(参考訳): ファジィハッシュを用いた変圧器ブースト異常検出
- Authors: Frieder Uhlig, Lukas Struppek, Dominik Hintersdorf, Kristian Kersting
- Abstract要約: 深層学習近似マッチング (DLAM) は, ファジィハッシュの異常検出において, 従来の手法よりもはるかに高い精度を実現する。
ファジィハッシュとディープラーニングは、特定のコンテンツの存在に応じてファイルを分類するのに適していることを示す。
DLAMは自然言語処理の分野でトランスフォーマーベースのモデルに依存し、既存の手法より優れている。
- 参考スコア(独自算出の注目度): 14.610958683256655
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fuzzy hashes are an important tool in digital forensics and are used in
approximate matching to determine the similarity between digital artifacts.
They translate the byte code of files into computable strings, which makes them
particularly interesting for intelligent machine processing. In this work, we
propose deep learning approximate matching (DLAM), which achieves much higher
accuracy in detecting anomalies in fuzzy hashes than conventional approaches.
In addition to the well-known application for clustering malware, we show that
fuzzy hashes and deep learning are indeed well-suited to classify files
according to the presence of certain content, e.g., malware. DLAM relies on
transformer-based models from the field of natural language processing and
outperforms existing methods. Traditional fuzzy hashes like TLSH and ssdeep
have a limited size and fail to detect file anomalies if they are relatively
small compared to the overall file size. DLAM, however, enables the detection
of such file correlations in the computed fuzzy hashes of TLSH and ssdeep, even
for anomaly sizes of less than 15%. It achieves comparable results to
state-of-the-art fuzzy hashing algorithms while relying on more efficient hash
computations and can, therefore, be used at a much larger scale.
- Abstract(参考訳): ファジィハッシュはデジタル法医学において重要なツールであり、デジタルアーティファクト間の類似性を決定するために近似マッチングで使用される。
ファイルのバイトコードを計算可能な文字列に変換することで、インテリジェントなマシン処理において特に興味深いものになります。
本研究では,ファジィハッシュの異常検出において,従来の手法よりもはるかに高精度な深層学習近似マッチング(DLAM)を提案する。
クラスタリングマルウェアのよく知られたアプリケーションに加えて、ファジィハッシュとディープラーニングが、マルウェアのような特定のコンテンツの存在に応じてファイルを分類するのに適していることを示す。
DLAMは自然言語処理の分野でトランスフォーマーベースのモデルに依存し、既存の手法より優れている。
tlshやssdeepのような従来のファジィハッシュはサイズが限られており、ファイルサイズに比べて比較的小さい場合はファイル異常を検出することができない。
しかし、DLAMは、15%未満の異常サイズであっても、TLSHとssdeepの計算されたファジィハッシュにおけるそのようなファイル相関を検出することができる。
より効率的なハッシュ計算を頼りながら、最先端のファジィハッシュアルゴリズムに匹敵する結果を達成し、それ故にはるかに大きなスケールで使用できる。
関連論文リスト
- Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Hidden Markov Models with Random Restarts vs Boosting for Malware
Detection [5.414308305392762]
我々は、マルウェア検出の文脈において、強化されたHMM(AdaBoostを使用)と複数のランダム再起動で訓練されたHMMを比較した。
ランダムな再起動は、ブースティングと比較して驚くほどうまく機能します。
論文 参考訳(メタデータ) (2023-07-17T13:21:58Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - Itemset Utility Maximization with Correlation Measure [8.581840054840335]
高ユーティリティアイテムセットマイニング(HUIM)は、興味深いが隠された情報(例えば、利益とリスク)を見つけるために使用される。
本稿では,Coium(Coium)を用いたアイテムセット実用性最大化という新しいアルゴリズムを提案する。
2つの上界と4つのプルーニング戦略を用いて探索空間を効果的にプルークする。また、適用された上界を線形時間と空間で計算・保存するために、ユーティリティービンと呼ばれる簡潔なアレイ構造を用いる。
論文 参考訳(メタデータ) (2022-08-26T10:06:24Z) - Using Convolutional Neural Networks to Detect Compression Algorithms [0.0]
ベースデータセットを使用し、さまざまなアルゴリズムですべてのファイルを圧縮し、それに基づいてモデルを設計します。
使用されるモデルは、圧縮、lzip、bzip2を使用して圧縮されたファイルを正確に識別することができた。
論文 参考訳(メタデータ) (2021-11-17T11:03:16Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - On the Importance of Encrypting Deep Features [15.340540198612823]
ユーザデータの特徴ベクトルが知られ、推論のためのブラックボックスAPIが提供される。
個人再識別における最先端モデルの実験を行い,2つの攻撃シナリオ(補助属性の認識とユーザデータの再構築)について検討した。
その結果、厳しい制約下であっても、敵は機密情報を推測することに成功した。
論文 参考訳(メタデータ) (2021-08-16T15:22:33Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z) - EnCoD: Distinguishing Compressed and Encrypted File Fragments [0.9239657838690228]
現在の手法では,大規模な断片サイズであっても,暗号化と圧縮を確実に区別することはできない。
圧縮されたデータと暗号化されたデータを確実に区別できる学習ベースの分類器であるEnCoDを,フラグメントから512バイトまで小さく設計する。
異なるデータ型の大規模なデータセットに対する現在のアプローチに対するEnCoDの評価を行い、最も検討されたフラグメントサイズやデータタイプに対して、現在の最先端よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-15T13:55:55Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。