論文の概要: SEED: Semi-supervised Continual MalwarE Detection for Tackling ConcEpt Drift on a BuDget
- arxiv url: http://arxiv.org/abs/2605.24903v1
- Date: Sun, 24 May 2026 07:04:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.500008
- Title: SEED: Semi-supervised Continual MalwarE Detection for Tackling ConcEpt Drift on a BuDget
- Title(参考訳): SEED: Budget上の凹凸ドリフトの半教師付き連続マルワール検出
- Authors: Suresh Kumar Amalapuram, Bikraj Shresta, Siva Ram murthy Chebiyam, Bheemarjuna Reddy Tamma, Sumohana S Channappayya,
- Abstract要約: 機械学習ベースのマルウェア検知器は、良性およびマルウェアアプリケーションにおける概念の漂流により、時間が経つにつれて時代遅れになっている。
近年の手法は、完全ラベル付きデータに依存し、階層的コントラスト損失(HCL)とアクティブラーニングを用いてドリフトに対するロバスト性を改善する。
限定的な監視下でのマルウェア検出のための意味構造に依存しないSEEDを提案する。
- 参考スコア(独自算出の注目度): 12.656727953831508
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning based malware detectors become obsolete over time due to concept drift in benign and malware applications. Recent methods rely on fully labeled data and use hierarchical contrastive loss (HCL) with active learning to improve robustness against drift by exploiting semantic structure in malware representations. However, obtaining labeled data in the security domain is difficult. Under partially labeled settings, HCL suffers significant performance degradation in detecting unseen malware, especially on datasets such as BODMAS where strong semantic structure may not exist. In this paper, we propose SEED, a semantic-structure-agnostic method for malware detection under limited supervision. SEED combines a tailored binary cross-entropy objective with semi-supervised continual learning and active learning. For partially labeled seen tasks, unlabeled samples are projected into a representation space constructed from previously seen data using singular value decomposition, and paired with suitable labeled samples to encourage representation consistency. For unseen tasks with fully unlabeled data, uncertainty is quantified using cosine distance in representation space, and the most uncertain samples are selected for analyst labeling. We evaluate SEED on both Windows and Android malware datasets. Using only 20% labeled data on seen tasks, SEED achieves average AUT improvements of 40% on BODMAS and 14% on AndroZoo for unseen malware detection compared to HCL* (the semi-supervised adaptation of HCL), while remaining competitive on APIGraph. Finally, we introduce a delayed buffer update strategy to reduce label noise propagation during replay and improve learning stability.
- Abstract(参考訳): 機械学習ベースのマルウェア検知器は、良性およびマルウェアアプリケーションにおける概念の漂流により、時間が経つにつれて時代遅れになっている。
近年の手法は,完全ラベル付きデータと階層的コントラスト損失(HCL)を用いて,マルウェア表現のセマンティック構造を利用して,ドリフトに対するロバスト性を向上させる。
しかし,セキュリティ領域におけるラベル付きデータの取得は困難である。
部分的にラベル付けされた設定の下では、HCLは、特に強力なセマンティック構造が存在しないBODMASのようなデータセットにおいて、目に見えないマルウェアの検出において、大幅なパフォーマンス劣化を被っている。
本稿では,限定的な監視下でのマルウェア検出のための意味構造に依存しないSEEDを提案する。
SEEDは、調整されたバイナリクロスエントロピー目的と、半教師付き連続学習とアクティブラーニングを組み合わせたものである。
部分的にラベル付けされたタスクの場合、ラベル付けされていないサンプルは、特異値分解を用いて以前のデータから構築された表現空間に投影され、適切なラベル付きサンプルと組み合わせて表現整合性を促進する。
完全ラベル付きデータを含む未知のタスクに対しては、表現空間におけるコサイン距離を用いて不確実性を定量化し、最も不確実なサンプルを分析ラベリングのために選択する。
我々はWindowsとAndroidの両方のマルウェアデータセット上でSEEDを評価した。
表示されたタスクのラベル付きデータは20%に過ぎず、SEEDは平均でBODMASで40%、AndroZooで14%の改善を実現している。
最後に,リプレイ時のラベルノイズ伝搬を低減し,学習安定性を向上させるため,バッファ更新を遅延させる手法を提案する。
関連論文リスト
- Attribution-Guided Multimodal Deepfake Detection via Cross-Modal Forensic Fingerprints [4.598350938853635]
ビデオの偽造方法を特定することができない検出器は、間違ったシグナルを学習している可能性が高い、と私たちは主張する。
二分検出とは異なり、帰属誘導学習は共有埋め込み空間に強い幾何学的制約を課す。
本稿では,属性検出と属性抽出を共同で学習する属性誘導型マルチモーダルディープフェイク検出フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-29T09:11:13Z) - Leave No TRACE: Black-box Detection of Copyrighted Dataset Usage in Large Language Models via Watermarking [51.74368870268278]
我々は,大規模な言語モデルにおける著作権付きデータセット使用量を完全にブラックボックスで検出するフレームワークであるTRACEを提案する。
textttTRACEは、プライベートキーでガイドされた歪みのない透かしでデータセットを書き換える。
さまざまなデータセットとモデルファミリにわたって、TRACEは一貫して重要な検出を実現している。
論文 参考訳(メタデータ) (2025-10-03T12:53:02Z) - Adversarial Augmentation and Active Sampling for Robust Cyber Anomaly Detection [1.102914654802229]
Advanced Persistent Threats (APTs)は、そのステルスで長期にわたる性質のために、サイバーセキュリティにかなり挑戦している。
従来の教師付き学習手法は、通常大量のラベル付きデータを必要とする。
本稿では,自動エンコーダによる異常検出と能動的学習を組み合わせて,APT検出を反復的に向上する手法を提案する。
論文 参考訳(メタデータ) (2025-09-05T10:47:49Z) - DRMD: Deep Reinforcement Learning for Malware Detection under Concept Drift [17.324132213093872]
我々は1ステップのマルコフ決定プロセスとしてマルウェア検出の新しい定式化を開発する。
深層強化学習(DRL)エージェントを訓練し、サンプル分類性能を最適化し、手動ラベリングのための高リスクサンプルを拒否する。
本研究は,DRLが効果的なマルウェア検出と,ドリフトの概念に対するレジリエンスを向上させることを初めて示すものである。
論文 参考訳(メタデータ) (2025-08-26T09:15:33Z) - CrossMatch: Enhance Semi-Supervised Medical Image Segmentation with Perturbation Strategies and Knowledge Distillation [7.6057981800052845]
CrossMatchは、ラベル付きデータとラベルなしデータの両方からモデルの学習を改善するために、知識蒸留とデュアル戦略レベルの機能レベルを統合する新しいフレームワークである。
本手法は,ラベル付きデータとラベルなしデータのトレーニングのギャップを効果的に最小化することにより,標準ベンチマークにおける他の最先端技術を大幅に超えている。
論文 参考訳(メタデータ) (2024-05-01T07:16:03Z) - Incorporating Semi-Supervised and Positive-Unlabeled Learning for
Boosting Full Reference Image Quality Assessment [73.61888777504377]
フル参照(FR)画像品質評価(IQA)は、その知覚的差異をプリズム品質基準で測定することにより、歪み画像の視覚的品質を評価する。
ラベルなしデータは、画像劣化または復元プロセスから容易に収集することができ、ラベルなしのトレーニングデータを利用してFR-IQA性能を高めることを奨励する。
本稿では, 半教師付き, 正の未ラベル学習(PU)を用いて, ラベルなしデータを活用し, オフレーヤの悪影響を軽減することを提案する。
論文 参考訳(メタデータ) (2022-04-19T09:10:06Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for
Semi-supervised Continual Learning [52.831894583501395]
連続学習は、入力されたデータが完全にラベル付けされていると仮定し、実際のアプリケーションでは適用できないかもしれない。
我々は、条件付き生成逆数ネットワーク(GAN)を用いた分類器を相互に学習するために、識別器整合(ORDisCo)を用いたディープオンライン再生を提案する。
ORDisCo が SSCL の様々な半教師付き学習ベンチマークデータセットで大幅なパフォーマンス向上を達成していることを示します。
論文 参考訳(メタデータ) (2021-01-02T09:04:14Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。