論文の概要: Machine Learning Transferability for Malware Detection
- arxiv url: http://arxiv.org/abs/2603.26632v1
- Date: Fri, 27 Mar 2026 17:32:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.619351
- Title: Machine Learning Transferability for Malware Detection
- Title(参考訳): マルウェア検出のための機械学習トランスファー
- Authors: César Vieira, João Vitorino, Eva Maia, Isabel Praça,
- Abstract要約: 本研究では,機械学習モデルを用いたポータブル実行可能ファイル(PE)の検出において,データ前処理手法の適合性を評価する。
事前処理パイプラインは、EMBERv2データセットを統一し、2つのトレーニング設定の下でペアモデルをトレーニングする。
EMBER + BODMASとEMBER + BODMAS + ERMDSは、トリチウム、インフェルノ、SOREL-20Mに対して試験される。
- 参考スコア(独自算出の注目度): 1.423280626666929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Malware continues to be a predominant operational risk for organizations, especially when obfuscation techniques are used to evade detection. Despite the ongoing efforts in the development of Machine Learning (ML) detection approaches, there is still a lack of feature compatibility in public datasets. This limits generalization when facing distribution shifts, as well as transferability to different datasets. This study evaluates the suitability of different data preprocessing approaches for the detection of Portable Executable (PE) files with ML models. The preprocessing pipeline unifies EMBERv2 (2,381-dim) features datasets, trains paired models under two training setups: EMBER + BODMAS and EMBER + BODMAS + ERMDS. Regarding model evaluation, both EMBER + BODMAS and EMBER + BODMAS + ERMDS models are tested against TRITIUM, INFERNO and SOREL-20M. ERMDS is also used for testing for the EMBER + BODMAS setup.
- Abstract(参考訳): マルウェアは、特に難読化技術が検出を回避するために使用される場合、組織にとって主要な運用上のリスクであり続けている。
機械学習(ML)検出アプローチの開発における継続的な取り組みにもかかわらず、パブリックデータセットにはまだ機能互換性が欠如している。
これにより、分散シフトに直面した際の一般化が制限され、異なるデータセットへの転送可能性も制限される。
本研究では,MLモデルを用いたポータブル実行可能ファイル(PE)の検出において,データ前処理手法の適合性を評価する。
前処理パイプラインは、EMBERv2(2,381-dim)を統一し、データセットと、EMBER + BODMASとEMBER + BODMAS + ERMDSの2つのトレーニング設定の下でペアモデルを訓練する。
モデル評価では,EMBER + BODMASとEMBER + BODMAS + ERMDSモデルの両方をTRITium,INFERNO,SOREL-20Mに対して試験した。
ERMDSはEMBER + BODMASセットアップのテストにも使用される。
関連論文リスト
- Revisiting Network Traffic Analysis: Compatible network flows for ML models [1.7181078670359513]
本稿では,異なるネットワークトラフィックフローの輸出者によって生成された類似した特徴が,機械学習モデルの一般化と堅牢性に与える影響について検討する。
侵入検知におけるこれらの新しい流れの有用性を評価するため、元のモデルと比較し、複数のモデルを微調整するために使用した。
論文 参考訳(メタデータ) (2025-11-11T15:23:56Z) - Mixture of Experts Approaches in Dense Retrieval Tasks [5.1004777867113225]
DRMを一般化するための最終トランスフォーマー層の後,単一のMoEブロック(SB-MoE)を提案する。
本実験は,ドメイン内の有効性とゼロショットの一般化性の両方を評価するための2つの評価設定を含む。
BERT-BaseやContrieverのような多くのパラメータを持つDRMの場合、我々のモデルは検索性能を向上させるために、より多くのトレーニングサンプルを必要とする。
論文 参考訳(メタデータ) (2025-10-17T14:23:19Z) - Crucial-Diff: A Unified Diffusion Model for Crucial Image and Annotation Synthesis in Data-scarce Scenarios [65.97836905826145]
医療、産業、自動運転といったさまざまなシナリオにおけるデータの不足は、モデルの過度な適合とデータセットの不均衡につながる。
重要なサンプルを合成するドメインに依存しないフレームワークであるCrucial-Diffを提案する。
我々のフレームワークは多様な高品質なトレーニングデータを生成し、ピクセルレベルのAPは83.63%、F1-MAXは78.12%である。
論文 参考訳(メタデータ) (2025-07-14T04:41:38Z) - APT-LLM: Embedding-Based Anomaly Detection of Cyber Advanced Persistent Threats Using Large Language Models [4.956245032674048]
APTは、ステルスと通常のシステム動作を模倣する能力のために、大きなサイバーセキュリティ上の課題を提起する。
本稿では,新しい埋め込み型異常検出フレームワークであるAPT-LLMを紹介する。
大規模な言語モデル(LLM)とオートエンコーダアーキテクチャを統合してAPTを検出する。
論文 参考訳(メタデータ) (2025-02-13T15:01:18Z) - Task-customized Masked AutoEncoder via Mixture of Cluster-conditional
Experts [104.9871176044644]
Masked Autoencoder (MAE) は,モデル事前学習において有望な結果が得られる自己教師型学習手法である。
我々は、新しいMAEベースの事前学習パラダイム、Mixture of Cluster-conditional Experts (MoCE)を提案する。
MoCEは、クラスタ条件ゲートを使用して、各専門家にセマンティックなイメージのみをトレーニングする。
論文 参考訳(メタデータ) (2024-02-08T03:46:32Z) - Deep Learning-Based Cyber-Attack Detection Model for Smart Grids [6.642400003243118]
監視制御とデータ取得(SCADA)により、受信した負荷データに対するデータ完全性サイバー攻撃(DIA)を防止するために、人工知能に基づく新しいサイバー攻撃検出モデルを開発した。
提案モデルでは、まず回帰モデルを用いて負荷データを予測し、処理後、教師なし学習法を用いて処理データをクラスタ化する。
提案したEE-BiLSTM法は,他の2つの手法と比較して,より堅牢かつ高精度に動作可能である。
論文 参考訳(メタデータ) (2023-12-14T10:54:04Z) - EMShepherd: Detecting Adversarial Samples via Side-channel Leakage [6.868995628617191]
敵対的攻撃は、ディープラーニングを駆使したクリティカルな応用にとって悲惨な結果をもたらす。
モデル実行の電磁的トレースを捕捉し、トレース上で処理を行い、敵検出に利用するためのフレームワークEMShepherdを提案する。
提案手法は,一般的に使用されているFPGA深層学習アクセラレータ上で,異なる敵攻撃を効果的に検出できることを実証する。
論文 参考訳(メタデータ) (2023-03-27T19:38:55Z) - Taming Sparsely Activated Transformer with Stochastic Experts [76.0711573018493]
わずかに活性化されたモデル(SAM)は、計算コストを大幅に増加させることなく、非常に大量のパラメータを持つように容易にスケールすることができる。
本稿では,新しいエキスパートベースモデルTHOR(Transformer witH StOchastic ExpeRts)を提案する。
Switch Transformerのような古典的なエキスパートベースのモデルとは異なり、THORの専門家はトレーニングと推論の間、各入力に対してランダムにアクティベートされる。
論文 参考訳(メタデータ) (2021-10-08T17:15:47Z) - DAE : Discriminatory Auto-Encoder for multivariate time-series anomaly
detection in air transportation [68.8204255655161]
識別オートエンコーダ(DAE)と呼ばれる新しい異常検出モデルを提案する。
通常のLSTMベースのオートエンコーダのベースラインを使用するが、いくつかのデコーダがあり、それぞれ特定の飛行フェーズのデータを取得する。
その結果,DAEは精度と検出速度の両方で良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-09-08T14:07:55Z) - Detecting Faults during Automatic Screwdriving: A Dataset and Use Case
of Anomaly Detection for Automatic Screwdriving [80.6725125503521]
障害検出に機械学習(ML)を使用したデータ駆動型アプローチが最近注目されている。
本稿では,自動スクリュー運転時の故障検出にMLモデルを用いた場合について述べる。
論文 参考訳(メタデータ) (2021-07-05T11:46:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。