論文の概要: Learning Temporal Invariance in Android Malware Detectors
- arxiv url: http://arxiv.org/abs/2502.05098v1
- Date: Fri, 07 Feb 2025 17:17:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:57:12.247657
- Title: Learning Temporal Invariance in Android Malware Detectors
- Title(参考訳): Androidマルウェア検出器における時間的不変性学習
- Authors: Xinran Zheng, Shuo Yang, Edith C. H. Ngai, Suman Jana, Lorenzo Cavallaro,
- Abstract要約: 学習ベースのAndroidマルウェア検出器は、マルウェアの変種と新しい家族によって引き起こされる自然分布の漂流により、時間とともに劣化する。
本稿では,経験的リスク (ERM) で訓練された最小化が,そのような分散シフトに直面する課題について,体系的に検討する。
本稿では,マルウェア検出のための時間的不変性トレーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 20.830702588122463
- License:
- Abstract: Learning-based Android malware detectors degrade over time due to natural distribution drift caused by malware variants and new families. This paper systematically investigates the challenges classifiers trained with empirical risk minimization (ERM) face against such distribution shifts and attributes their shortcomings to their inability to learn stable discriminative features. Invariant learning theory offers a promising solution by encouraging models to generate stable representations crossing environments that expose the instability of the training set. However, the lack of prior environment labels, the diversity of drift factors, and low-quality representations caused by diverse families make this task challenging. To address these issues, we propose TIF, the first temporal invariant training framework for malware detection, which aims to enhance the ability of detectors to learn stable representations across time. TIF organizes environments based on application observation dates to reveal temporal drift, integrating specialized multi-proxy contrastive learning and invariant gradient alignment to generate and align environments with high-quality, stable representations. TIF can be seamlessly integrated into any learning-based detector. Experiments on a decade-long dataset show that TIF excels, particularly in early deployment stages, addressing real-world needs and outperforming state-of-the-art methods.
- Abstract(参考訳): 学習ベースのAndroidマルウェア検出器は、マルウェアの変種と新しい家族によって引き起こされる自然分布の漂流により、時間とともに劣化する。
本稿では,経験的リスク最小化(ERM)を訓練した分類器が,そのような分布シフトに直面する課題を体系的に検討し,その欠点として,安定した識別的特徴を学習できないことを挙げる。
不変学習理論は、トレーニングセットの不安定性を露呈する安定した表現を横断する環境を生成するようモデルに促すことによって、有望な解決策を提供する。
しかし, 環境ラベルの欠如, 漂流要因の多様性, 多様な家族による低品質表現が課題となっている。
これらの問題に対処するために,マルウェア検出のための最初の時間的不変トレーニングフレームワークであるTIFを提案する。
TIFは、時間的ドリフトを明らかにするために、アプリケーション観測日に基づいて環境を整理し、特殊なマルチプロキシのコントラスト学習と不変勾配アライメントを統合して、高品質で安定した表現で環境を生成し調整する。
TIFは任意の学習ベースの検出器にシームレスに統合できる。
10年に及ぶデータセットの実験によると、TIFは、特に初期のデプロイメント段階で、現実世界のニーズに対処し、最先端の手法よりも優れています。
関連論文リスト
- Time-Series Forecasting for Out-of-Distribution Generalization Using Invariant Learning [33.68869067717862]
時系列予測(TSF)は、現実世界のシナリオにおいて幅広い応用を見出す。
本稿では,TSFにおける固有のOOD問題を不変学習を用いて緩和することを目的とする。
Invariant Learning によるアウト・オブ・ディストリビューションの一般化のための時系列予測を可能にするモデルに依存しないフレームワーク FOIL を提案する。
論文 参考訳(メタデータ) (2024-06-13T14:01:34Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Unleashing the Power of Graph Data Augmentation on Covariate
Distribution Shift [50.98086766507025]
本稿では,AIA(Adversarial Invariant Augmentation)という,シンプルで効率の良いデータ拡張戦略を提案する。
AIAは、拡張プロセス中に元の安定した特徴を同時に保存しながら、新しい環境をエクスポーレーションし、生成することを目的としている。
論文 参考訳(メタデータ) (2022-11-05T07:55:55Z) - Sufficient Invariant Learning for Distribution Shift [20.88069274935592]
本稿では,SIL(Sufficient Invariant Learning)フレームワークという新しい学習原理を紹介する。
SILは、単一の機能に頼るのではなく、不変機能の十分なサブセットを学ぶことに重点を置いている。
本稿では,適応シャープネスを意識したグループ分散ロバスト最適化(ASGDRO)を提案する。
論文 参考訳(メタデータ) (2022-10-24T18:34:24Z) - Intrinsic Anomaly Detection for Multi-Variate Time Series [33.199682596741276]
固有の異常は、環境を表す時系列と、その環境に置かれるシステムの内部状態を表す時系列の間の機能的依存構造の変化である。
これらのことは、システムの状態の変化と予期せぬ変化、すなわち環境の影響から逸脱するシステムの変化を区別できない既存の異常検出手法の欠点に対処する。
我々の最も有望なアプローチは、完全に教師なしであり、敵対的学習と時系列表現学習を組み合わせることで、ラベルの空間性や主観性といった問題に対処する。
論文 参考訳(メタデータ) (2022-06-29T00:51:44Z) - Robots Autonomously Detecting People: A Multimodal Deep Contrastive
Learning Method Robust to Intraclass Variations [6.798578739481274]
本稿では,クラス内変動下での人検出の移動ロボット問題に対処する,新しいマルチモーダル人検出アーキテクチャを提案する。
本稿では,1)時間不変なマルチモーダルコントラスト学習(TimCLR)と,2)MFRCNN(Multimal Faster R-CNN)検出器を用いた2段階学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-01T02:36:17Z) - Attribute-Guided Adversarial Training for Robustness to Natural
Perturbations [64.35805267250682]
本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。
我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文 参考訳(メタデータ) (2020-12-03T10:17:30Z) - Learning perturbation sets for robust machine learning [97.6757418136662]
我々は、潜在空間の制約領域上に設定された摂動を定義する条件生成器を用いる。
学習した摂動集合の質を定量的かつ質的に測定する。
我々は、学習した摂動集合を利用して、敵画像の破損や逆光の変動に対して経験的かつ確実に堅牢なモデルを訓練する。
論文 参考訳(メタデータ) (2020-07-16T16:39:54Z) - Adaptive Risk Minimization: Learning to Adapt to Domain Shift [109.87561509436016]
ほとんどの機械学習アルゴリズムの基本的な前提は、トレーニングとテストデータは、同じ基礎となる分布から引き出されることである。
本研究では,学習データをドメインに構造化し,複数のテスト時間シフトが存在する場合の領域一般化の問題点について考察する。
本稿では、適応リスク最小化(ARM)の枠組みを紹介し、モデルがトレーニング領域に適応することを学ぶことで、効果的な適応のために直接最適化される。
論文 参考訳(メタデータ) (2020-07-06T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。