論文の概要: Combining AI and AM - Improving Approximate Matching through Transformer
Networks
- arxiv url: http://arxiv.org/abs/2208.11367v3
- Date: Thu, 27 Apr 2023 15:43:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-28 17:26:02.877409
- Title: Combining AI and AM - Improving Approximate Matching through Transformer
Networks
- Title(参考訳): aiとamの組み合わせ - トランスフォーマーネットワークによる近似マッチングの改善
- Authors: Frieder Uhlig, Lukas Struppek, Dominik Hintersdorf, Thomas G\"obel,
Harald Baier, Kristian Kersting
- Abstract要約: 近似マッチング(英: Approximate matching, AM)は、デジタル法医学において、デジタルアーティファクト間の類似性を決定する概念である。
本稿では,自然言語処理分野からの変換器モデルに基づくマッチングアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 12.466612431413711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Approximate matching (AM) is a concept in digital forensics to determine the
similarity between digital artifacts. An important use case of AM is the
reliable and efficient detection of case-relevant data structures on a
blacklist, if only fragments of the original are available. For instance, if
only a cluster of indexed malware is still present during the digital forensic
investigation, the AM algorithm shall be able to assign the fragment to the
blacklisted malware. However, traditional AM functions like TLSH and ssdeep
fail to detect files based on their fragments if the presented piece is
relatively small compared to the overall file size. A second well-known issue
with traditional AM algorithms is the lack of scaling due to the
ever-increasing lookup databases. We propose an improved matching algorithm
based on transformer models from the field of natural language processing. We
call our approach Deep Learning Approximate Matching (DLAM). As a concept from
artificial intelligence (AI), DLAM gets knowledge of characteristic blacklisted
patterns during its training phase. Then DLAM is able to detect the patterns in
a typically much larger file, that is DLAM focuses on the use case of fragment
detection. We reveal that DLAM has three key advantages compared to the
prominent conventional approaches TLSH and ssdeep. First, it makes the tedious
extraction of known to be bad parts obsolete, which is necessary until now
before any search for them with AM algorithms. This allows efficient
classification of files on a much larger scale, which is important due to
exponentially increasing data to be investigated. Second, depending on the use
case, DLAM achieves a similar or even significantly higher accuracy in
recovering fragments of blacklisted files. Third, we show that DLAM enables the
detection of file correlations in the output of TLSH and ssdeep even for small
fragment sizes.
- Abstract(参考訳): 近似マッチング (mm) はデジタル・フォレンジスにおけるデジタル・アーティファクト間の類似性を決定するための概念である。
AMの重要なユースケースは、オリジナルの断片のみが利用可能であれば、ブラックリスト上のケース関連データ構造の信頼性と効率的な検出である。
例えば、デジタル法医学調査中にインデックス化されたマルウェアのクラスタのみがまだ存在する場合、AMアルゴリズムはブラックリスト化されたマルウェアにフラグメントを割り当てることができる。
しかし、tlshやssdeepのような従来のam関数は、ファイルサイズが全体のサイズに比べて比較的小さい場合、フラグメントに基づいてファイルを検出することができない。
従来のamアルゴリズムで2番目によく知られた問題は、検索データベースの増大によるスケーリングの欠如である。
本稿では,自然言語処理分野からの変換器モデルに基づくマッチングアルゴリズムを提案する。
私たちは、Deep Learning Approximate Matching (DLAM)と呼んでいる。
人工知能(AI)の概念として、DLAMはトレーニング期間中に特徴的なブラックリストパターンの知識を得る。
そしてDLAMは、一般的にもっと大きなファイルのパターンを検出でき、DLAMはフラグメント検出のユースケースに焦点を当てます。
従来のTLSHとssdeepに比べ,DLAMには3つの利点があることがわかった。
第一に、悪質な部分の退屈な抽出を時代遅れにするので、AMアルゴリズムでそれらを検索する前には、これまで必要だった。
これにより、より大規模なファイルの効率的な分類が可能になるが、これは調査対象の指数的に増加するデータのために重要である。
第二に、ユースケースによっては、DLAMはブラックリストファイルの断片を復元する際に、類似またはさらに高い精度を達成する。
第3に,小さなフラグメントサイズであっても,DLAMはTLSHとssdeepの出力中のファイル相関を検出することができることを示す。
関連論文リスト
- Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Hidden Markov Models with Random Restarts vs Boosting for Malware
Detection [5.414308305392762]
我々は、マルウェア検出の文脈において、強化されたHMM(AdaBoostを使用)と複数のランダム再起動で訓練されたHMMを比較した。
ランダムな再起動は、ブースティングと比較して驚くほどうまく機能します。
論文 参考訳(メタデータ) (2023-07-17T13:21:58Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - Itemset Utility Maximization with Correlation Measure [8.581840054840335]
高ユーティリティアイテムセットマイニング(HUIM)は、興味深いが隠された情報(例えば、利益とリスク)を見つけるために使用される。
本稿では,Coium(Coium)を用いたアイテムセット実用性最大化という新しいアルゴリズムを提案する。
2つの上界と4つのプルーニング戦略を用いて探索空間を効果的にプルークする。また、適用された上界を線形時間と空間で計算・保存するために、ユーティリティービンと呼ばれる簡潔なアレイ構造を用いる。
論文 参考訳(メタデータ) (2022-08-26T10:06:24Z) - Using Convolutional Neural Networks to Detect Compression Algorithms [0.0]
ベースデータセットを使用し、さまざまなアルゴリズムですべてのファイルを圧縮し、それに基づいてモデルを設計します。
使用されるモデルは、圧縮、lzip、bzip2を使用して圧縮されたファイルを正確に識別することができた。
論文 参考訳(メタデータ) (2021-11-17T11:03:16Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - On the Importance of Encrypting Deep Features [15.340540198612823]
ユーザデータの特徴ベクトルが知られ、推論のためのブラックボックスAPIが提供される。
個人再識別における最先端モデルの実験を行い,2つの攻撃シナリオ(補助属性の認識とユーザデータの再構築)について検討した。
その結果、厳しい制約下であっても、敵は機密情報を推測することに成功した。
論文 参考訳(メタデータ) (2021-08-16T15:22:33Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z) - EnCoD: Distinguishing Compressed and Encrypted File Fragments [0.9239657838690228]
現在の手法では,大規模な断片サイズであっても,暗号化と圧縮を確実に区別することはできない。
圧縮されたデータと暗号化されたデータを確実に区別できる学習ベースの分類器であるEnCoDを,フラグメントから512バイトまで小さく設計する。
異なるデータ型の大規模なデータセットに対する現在のアプローチに対するEnCoDの評価を行い、最も検討されたフラグメントサイズやデータタイプに対して、現在の最先端よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-15T13:55:55Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。