論文の概要: PackHero: A Scalable Graph-based Approach for Efficient Packer Identification
- arxiv url: http://arxiv.org/abs/2506.00659v1
- Date: Sat, 31 May 2025 18:01:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.396467
- Title: PackHero: A Scalable Graph-based Approach for Efficient Packer Identification
- Title(参考訳): PackHero: 効率的なパッカー識別のためのスケーラブルなグラフベースのアプローチ
- Authors: Marco Di Gennaro, Mario D'Onghia, Mario Polino, Stefano Zanero, Michele Carminati,
- Abstract要約: PackHeroは、パッカーを特定するためのスケーラブルで効率的な方法論である。
我々は,各種パッカーを詰めたマルウェアと良性サンプルの公開データセットに対するアプローチを評価した。
PackHeroのマクロ平均F1スコアは93.7%、パッカー1個あたり10サンプルで、100サンプルで98.3%に改善されている。
- 参考スコア(独自算出の注目度): 4.939948478457799
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anti-analysis techniques, particularly packing, challenge malware analysts, making packer identification fundamental. Existing packer identifiers have significant limitations: signature-based methods lack flexibility and struggle against dynamic evasion, while Machine Learning approaches require extensive training data, limiting scalability and adaptability. Consequently, achieving accurate and adaptable packer identification remains an open problem. This paper presents PackHero, a scalable and efficient methodology for identifying packers using a novel static approach. PackHero employs a Graph Matching Network and clustering to match and group Call Graphs from programs packed with known packers. We evaluate our approach on a public dataset of malware and benign samples packed with various packers, demonstrating its effectiveness and scalability across varying sample sizes. PackHero achieves a macro-average F1-score of 93.7% with just 10 samples per packer, improving to 98.3% with 100 samples. Notably, PackHero requires fewer samples to achieve stable performance compared to other Machine Learning-based tools. Overall, PackHero matches the performance of State-of-the-art signature-based tools, outperforming them in handling Virtualization-based packers such as Themida/Winlicense, with a recall of 100%.
- Abstract(参考訳): アンチアナリシス技術、特にパッキングは、マルウェアアナリストに挑戦し、パッカーの識別を基本的なものにしている。
署名ベースのメソッドには柔軟性がなく、動的回避に苦労する一方で、マシンラーニングアプローチでは広範なトレーニングデータを必要とし、スケーラビリティと適応性を制限している。
したがって、正確かつ適応可能なパッカー識別を実現することは、未解決の問題である。
本稿では,新しい静的アプローチを用いてパッカーを識別する,スケーラブルで効率的な手法であるPackHeroを提案する。
PackHeroはGraph Matching Networkとクラスタリングを使用して、既知のパッカーを詰め込んだプログラムからコールグラフをマッチングし、グループ化する。
我々は,各種パッカーを詰め込んだマルウェアと良性サンプルの公開データセットに対するアプローチを評価し,その有効性と,様々なサンプルサイズにわたるスケーラビリティを実証した。
PackHeroのマクロ平均F1スコアは93.7%、パッカー1個あたり10サンプルで、100サンプルで98.3%に改善されている。
特に、PackHeroは、他の機械学習ベースのツールと比べて安定したパフォーマンスを達成するのに、サンプルが少ない。
PackHeroは全体として、最先端のシグネチャベースのツールのパフォーマンスにマッチし、Themida/Winlicenseのような仮想化ベースのパッカーの処理において、100%のリコールでパフォーマンスに優れています。
関連論文リスト
- Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning [28.38312460468955]
Packingは、異なるトレーニングシーケンスを組み合わせて、モデルの最大入力長に適合させることで、ハードウェアリソース効率を最大化する最適化技術である。
本稿では,69Kから1.2Mのデータセットと8Bから70Bのモデルを対象として,パディングとパッキングを用いたSFT法の比較を行った。
これは、パッキング対パディングの利点と制限に関する最初の包括的な分析と、さまざまなトレーニングシナリオでパッキングを実装するための実践的な考慮を提供する。
論文 参考訳(メタデータ) (2024-10-10T16:25:34Z) - Semi-supervised 3D Object Detection with PatchTeacher and PillarMix [71.4908268136439]
現在の半教師付き3Dオブジェクト検出法では、教師が学生に擬似ラベルを生成するのが一般的である。
学生に高品質な擬似ラベルを提供するために,部分的なシーン3Dオブジェクト検出に焦点を当てたPatchTeacherを提案する。
本稿では,PatchTeacherの性能向上のために,Patch Normalizer,Quadrant Align,Fovea Selectionの3つの重要なテクニックを紹介する。
論文 参考訳(メタデータ) (2024-07-13T06:58:49Z) - Federated Face Forgery Detection Learning with Personalized Representation [63.90408023506508]
ディープジェネレータ技術は、区別がつかない高品質のフェイクビデオを制作し、深刻な社会的脅威をもたらす可能性がある。
従来の偽造検出手法は、データを直接集中的に訓練する。
本稿では,個人化表現を用いた新しいフェデレーション顔偽造検出学習を提案する。
論文 参考訳(メタデータ) (2024-06-17T02:20:30Z) - A Large-scale Fine-grained Analysis of Packages in Open-Source Software Ecosystems [13.610690659041417]
悪意のあるパッケージはメタデータの内容が少なく、正規のパッケージよりも静的関数や動的関数が少ない。
きめ細かい情報(FGI)の1次元は、悪意のあるパッケージを検出するのに十分な識別能力を持っている。
論文 参考訳(メタデータ) (2024-04-17T15:16:01Z) - Matcher: Segment Anything with One Shot Using All-Purpose Feature
Matching [63.88319217738223]
市販の視覚基礎モデルを用いて様々な知覚課題に対処する新しい知覚パラダイムであるMatcherを提案する。
Matcherは、様々なセグメンテーションタスクにまたがる印象的な一般化パフォーマンスを、すべてトレーニングなしでデモする。
我々の結果は、野生の画像に適用されたMatcherのオープンワールドの一般性と柔軟性をさらに示すものである。
論文 参考訳(メタデータ) (2023-05-22T17:59:43Z) - An Efficient Multi-Step Framework for Malware Packing Identification [0.8594140167290096]
そこで本研究では,サンプルの分類と識別を行うフレームワークを提案する。
最初のステップでは、CARTアルゴリズムと置換重要度を用いて、重要な20の機能をプリセレクトする。
第2のステップでは、各モデルが、満載ファイルを最高のパフォーマンスで分類するための20の事前選択された特徴を学習する。
論文 参考訳(メタデータ) (2022-08-17T05:03:14Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Fully-Automated Packaging Structure Recognition in Logistics
Environments [60.56493342808093]
包装構造認識の完全自動化手法を提案する。
我々のアルゴリズムは深層学習モデルに基づいており、より正確に畳み込みニューラルネットワークを用いて画像のセグメント化を行う。
テストケースの約85%でパッケージ構造を正しく認識することができ、さらに一般的なパッケージタイプに注目する場合(91%)にさらに多くのパッケージ構造を認識できることを示す。
論文 参考訳(メタデータ) (2020-08-11T10:57:23Z) - Large-Scale Object Detection in the Wild from Imbalanced Multi-Labels [128.77822070156057]
本研究では,対象物が明示的にあるいは暗黙的に複数のラベルを持つ可能性のあるラベル問題を定量的に解析する。
ラベルの不均衡に対処するために,ハイブリッドトレーニングスケジューラを用いたソフトサンプリング手法を提案する。
提案手法は3.34点の劇的な改善を実現し,オープンイメージの公開オブジェクト検出テストセット上で60.90mAPの最高の単一モデルを実現する。
論文 参考訳(メタデータ) (2020-05-18T04:36:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。