論文の概要: Label-efficient Training Updates for Malware Detection over Time
- arxiv url: http://arxiv.org/abs/2603.28396v1
- Date: Mon, 30 Mar 2026 13:05:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.40514
- Title: Label-efficient Training Updates for Malware Detection over Time
- Title(参考訳): 時間経過によるマルウェア検出のためのラベル効率向上トレーニング更新
- Authors: Luca Minnei, Cristian Manca, Giorgio Piras, Angelo Sotgiu, Maura Pintor, Daniele Ghiani, Davide Maiorca, Giorgio Giacinto, Battista Biggio,
- Abstract要約: 本稿では,活動学習と半教師あり学習の幅広いセットを評価するモデルに依存しないフレームワークを提案する。
これらの手法を組み合わせることで、両方のドメインで手動アノテーションのコストを最大90%削減できることを示す。
- 参考スコア(独自算出の注目度): 8.827428718141467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML)-based detectors are becoming essential to counter the proliferation of malware. However, common ML algorithms are not designed to cope with the dynamic nature of real-world settings, where both legitimate and malicious software evolve. This distribution drift causes models trained under static assumptions to degrade over time unless they are continuously updated. Regularly retraining these models, however, is expensive, since labeling new acquired data requires costly manual analysis by security experts. To reduce labeling costs and address distribution drift in malware detection, prior work explored active learning (AL) and semi-supervised learning (SSL) techniques. Yet, existing studies (i) are tightly coupled to specific detector architectures and restricted to a specific malware domain, resulting in non-uniform comparisons; and (ii) lack a consistent methodology for analyzing the distribution drift, despite the critical sensitivity of the malware domain to temporal changes. In this work, we bridge this gap by proposing a model-agnostic framework that evaluates an extensive set of AL and SSL techniques, isolated and combined, for Android and Windows malware detection. We show that these techniques, when combined, can reduce manual annotation costs by up to 90% across both domains while achieving comparable detection performance to full-labeling retraining. We also introduce a methodology for feature-level drift analysis that measures feature stability over time, showing its correlation with the detector performance. Overall, our study provides a detailed understanding of how AL and SSL behave under distribution drift and how they can be successfully combined, offering practical insights for the design of effective detectors over time.
- Abstract(参考訳): 機械学習(ML)ベースの検出器は、マルウェアの拡散に対抗するために欠かせないものになりつつある。
しかし、一般的なMLアルゴリズムは、正当なソフトウェアと悪意のあるソフトウェアの両方が進化する現実世界の設定の動的な性質に対処するようには設計されていない。
この分布ドリフトは、静的な仮定の下で訓練されたモデルが継続的に更新されない限り、時間とともに劣化する原因となる。
しかし、新しい取得したデータのラベル付けには、セキュリティ専門家による手作業によるコストがかかるため、これらのモデルの定期的な再トレーニングはコストがかかる。
マルウェア検出におけるラベリングコストとアドレス分布のドリフトを低減するため、以前の研究ではアクティブラーニング(AL)と半教師付きラーニング(SSL)技術を検討した。
しかし、現存する研究
i)特定の検出器アーキテクチャに密結合し、特定のマルウェアドメインに制限され、結果として一様でない比較が行われます。
(II) 時間的変化に対するマルウェア領域の重大な感受性にもかかわらず, 分布ドリフトを解析するための一貫した方法論が欠如している。
本研究は,Android と Windows のマルウェア検出において,AL および SSL テクニックの広範なセットを分離・組み合わせて評価する,モデルに依存しないフレームワークを提案することによって,このギャップを埋めるものである。
これらの手法を組み合わせれば、両方のドメインにまたがる手動アノテーションのコストを最大90%削減し、フルラベルの再トレーニングに匹敵する検出性能を達成できることを示す。
また,時間とともに特徴の安定性を測る特徴レベルのドリフト解析手法を導入し,検出性能と相関を示す。
全体的な研究は、ALとSSLが分散流下でどのように振る舞うか、どのように組み合わせられるのかを詳細に理解し、効率的な検出器の設計に時間をかけて実践的な洞察を提供する。
関連論文リスト
- AI-Powered Algorithms for the Prevention and Detection of Computer Malware Infections [0.24919281650930605]
本研究では,人工知能(AI)に基づくコンテキスト認識型ハイブリッドマルウェア検出フレームワークを提案する。
この新しいアプローチは、97.3%の精度で優れたパフォーマンスを提供し、同じ分野で確立されたいくつかの機械学習(ML)やディープラーニング(DL)と比較して、1.5%の偽陽性率と最小限の検出遅延しか得られない。
論文 参考訳(メタデータ) (2026-01-09T02:14:34Z) - LLM-Enhanced Reinforcement Learning for Time Series Anomaly Detection [1.1852406625172216]
時系列異常検出は、しばしばスパースラベル、複雑な時間パターン、高価な専門家アノテーションに悩まされる。
本稿では,LL(Reinforcement Learning),VAE(Variational Autoencoder)の強化された動的報酬スケーリング,ラベル伝搬によるアクティブラーニングを併用した,LLM(Large Language Model)に基づく報酬形成機能の統合フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-05T19:33:30Z) - DRMD: Deep Reinforcement Learning for Malware Detection under Concept Drift [17.324132213093872]
我々は1ステップのマルコフ決定プロセスとしてマルウェア検出の新しい定式化を開発する。
深層強化学習(DRL)エージェントを訓練し、サンプル分類性能を最適化し、手動ラベリングのための高リスクサンプルを拒否する。
本研究は,DRLが効果的なマルウェア検出と,ドリフトの概念に対するレジリエンスを向上させることを初めて示すものである。
論文 参考訳(メタデータ) (2025-08-26T09:15:33Z) - A Sysmon Incremental Learning System for Ransomware Analysis and Detection [1.495391051525033]
サイバー脅威、特にランサムウェア攻撃の増加に直面しているため、高度な検知と分析システムの必要性が高まっている。
これらの提案のほとんどは、新しいランサムウェアを検出するために、基礎となるモデルをスクラッチから更新する必要がある、非インクリメンタルな学習アプローチを活用している。
新たなランサムウェア株がモデルが更新されるまで検出されない可能性があるため、再トレーニング中に攻撃に対して脆弱なデータを残すため、このアプローチは問題となる。
本稿では,Sysmon Incremental Learning System for Analysis and Detection (SILRAD)を提案する。
論文 参考訳(メタデータ) (2025-01-02T06:22:58Z) - Revisiting Concept Drift in Windows Malware Detection: Adaptation to Real Drifted Malware with Minimal Samples [10.352741619176383]
本研究では,ドリフトマルウェアの検出と分類を行う新しい手法を提案する。
グラフニューラルネットワークと対向ドメイン適応を利用して、マルウェア制御フローグラフのドリフト不変性を学習する。
当社のアプローチは,公開ベンチマークや,セキュリティ企業によって毎日報告されている実世界のマルウェアデータベース上でのドリフトマルウェアの検出を大幅に改善する。
論文 参考訳(メタデータ) (2024-07-18T22:06:20Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - InferAligner: Inference-Time Alignment for Harmlessness through
Cross-Model Guidance [56.184255657175335]
我々は,無害アライメントのためのクロスモデルガイダンスを利用する新しい推論時間アライメント手法であるtextbfInferAligner を開発した。
実験結果から,本手法はファイナンス,医学,数学の分野特化モデルに極めて効果的に適用可能であることが示された。
これは有害な命令とジェイルブレイク攻撃の両方のアタック成功率(ASR)を著しく低下させ、下流タスクではほとんど変化のないパフォーマンスを維持している。
論文 参考訳(メタデータ) (2024-01-20T10:41:03Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。