論文の概要: Adaptive Malware Detection using Sequential Feature Selection: A Dueling Double Deep Q-Network (D3QN) Framework for Intelligent Classification
- arxiv url: http://arxiv.org/abs/2507.04372v1
- Date: Sun, 06 Jul 2025 12:37:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.145347
- Title: Adaptive Malware Detection using Sequential Feature Selection: A Dueling Double Deep Q-Network (D3QN) Framework for Intelligent Classification
- Title(参考訳): 逐次特徴選択を用いた適応型マルウェア検出:知的分類のための二重Q-Network(D3QN)フレームワーク
- Authors: Naseem Khan, Aref Y. Al-Tamimi, Amine Bermak, Issa M. Khalil,
- Abstract要約: マルウェアの分類をマルコフ決定プロセスとして定式化する。
適応型逐次特徴選択のためのD3QN(Dueling Double Deep Q-Network)フレームワークを提案する。
Microsoft Big2015(9クラス,1,795機能)とBODMAS(バイナリ,2,381機能)データセットに対するアプローチを評価します。
- 参考スコア(独自算出の注目度): 1.4120905648647635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional malware detection methods exhibit computational inefficiency due to exhaustive feature extraction requirements, creating accuracy-efficiency trade-offs that limit real-time deployment. We formulate malware classification as a Markov Decision Process with episodic feature acquisition and propose a Dueling Double Deep Q-Network (D3QN) framework for adaptive sequential feature selection. The agent learns to dynamically select informative features per sample before terminating with classification decisions, optimizing both detection accuracy and computational cost through reinforcement learning. We evaluate our approach on Microsoft Big2015 (9-class, 1,795 features) and BODMAS (binary, 2,381 features) datasets. D3QN achieves 99.22% and 98.83% accuracy while utilizing only 61 and 56 features on average, representing 96.6% and 97.6% dimensionality reduction. This yields computational efficiency improvements of 30.1x and 42.5x over traditional ensemble methods. Comprehensive ablation studies demonstrate consistent superiority over Random Forest, XGBoost, and static feature selection approaches. Quantitative analysis demonstrates that D3QN learns non-random feature selection policies with 62.5% deviation from uniform baseline distributions. The learned policies exhibit structured hierarchical preferences, utilizing high-level metadata features for initial assessment while selectively incorporating detailed behavioral features based on classification uncertainty. Feature specialization analysis reveals 57.7% of examined features demonstrate significant class-specific discrimination patterns. Our results validate reinforcement learning-based sequential feature selection for malware classification, achieving superior accuracy with substantial computational reduction through learned adaptive policies.
- Abstract(参考訳): 従来のマルウェア検出手法は、全体的な特徴抽出要求による計算効率の低下を示し、リアルタイムデプロイメントを制限する精度と効率のトレードオフを生み出している。
マルウェアをマルコフ決定プロセスとして定式化し,適応的な逐次的特徴選択のためのD3QN(Dueling Double Deep Q-Network)フレームワークを提案する。
エージェントは、分類決定を終了する前に、サンプルごとの情報的特徴を動的に選択し、強化学習により検出精度と計算コストの両方を最適化する。
Microsoft Big2015(9クラス,1,795機能)とBODMAS(バイナリ,2,381機能)データセットに対するアプローチを評価します。
D3QN は 99.22% と 98.83% の精度を達成し、平均で 61 と 56 の機能しか利用していない。
これにより従来のアンサンブル法よりも30.1xと42.5xの計算効率が向上した。
包括的アブレーション研究はランダムフォレストやXGBoost、静的特徴選択アプローチよりも一貫した優位性を示している。
定量的解析により、D3QNは不規則な特徴選択ポリシーを62.5%の偏差で学習することを示した。
学習方針は階層的嗜好を構造化し, 分類の不確実性に基づく詳細な行動特徴を選択的に取り入れつつ, 初期評価に高レベルメタデータ機能を利用する。
特徴特化分析によると、調査対象の57.7%は、有意なクラス固有の識別パターンを示している。
本研究は,マルウェア分類における強化学習に基づく逐次的特徴選択を検証し,学習適応ポリシーを通した計算量削減の精度を向上した。
関連論文リスト
- Classifying Dental Care Providers Through Machine Learning with Features Ranking [0.0]
本研究では, 歯科医療機関の分類における機械学習(ML)モデルの適用について検討した。
データセットには、サービスカウント(予防、治療、試験)、デリバリーシステム(FFS、管理ケア)、受益者の人口統計が含まれる。
本研究は,モデル効率と精度の向上における特徴選択の重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-06-04T21:45:40Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Enhancing Classification Performance via Reinforcement Learning for
Feature Selection [0.0]
本研究では,分類モデルの性能向上における効果的な特徴選択の重要性について検討する。
本稿では、強化学習(RL)アルゴリズム、特にQ-learning(QL)とSARSA学習を用いることで、特徴選択の課題に対処する。
論文 参考訳(メタデータ) (2024-03-09T18:34:59Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Clustering and Ranking: Diversity-preserved Instruction Selection through Expert-aligned Quality Estimation [56.13803674092712]
本稿では,産業に優しく,専門家に順応し,多様性に配慮した指導データ選択手法を提案する:クラスタリングとランキング(CaR)
CaRは2段階のプロセスを採用している: まず、専門家の好みに合わせた高精度(84.25%)のスコアリングモデルを使用して、命令ペアをランク付けする。
我々の実験では、CaRはAlpacaのITデータのわずか1.96%を効率よく選択したが、結果のAlpaCaRモデルはGPT-4の評価において平均32.1%の精度でAlpacaのパフォーマンスを上回った。
論文 参考訳(メタデータ) (2024-02-28T09:27:29Z) - Ransomware detection using stacked autoencoder for feature selection [0.0]
この研究は、オートエンコーダの学習したウェイトとアクティベーションを慎重に分析し、ランサムウェアファミリーと他のマルウェアを区別するための重要な特徴を特定します。
提案手法はランサムウェア分類において, Extreme Gradient Boosting (XGBoost) アルゴリズムを上回り, 99%の精度を達成している。
論文 参考訳(メタデータ) (2024-02-17T17:31:48Z) - Leveraging Uncertainty Estimates To Improve Classifier Performance [4.4951754159063295]
バイナリ分類では、正のクラスのモデルスコアが、アプリケーション要求に基づいて選択されたしきい値を超えるかどうかに基づいて、インスタンスのラベルを予測する。
しかし、モデルスコアは真の肯定率と一致しないことが多い。
これは特に、クラス間の差分サンプリングを含むトレーニングや、トレインとテスト設定間の分散ドリフトがある場合に当てはまる。
論文 参考訳(メタデータ) (2023-11-20T12:40:25Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Adaptive Threshold for Better Performance of the Recognition and
Re-identification Models [0.0]
LFWデータセットと自己準備型アスリートデータセット上で,オンライン最適化に基づく統計的特徴学習適応技術を開発した。
適応しきい値を採用するこの方法は、通常任意の分類および識別タスクでヒットアンドトライ法を介して取られる固定しきい値0.3,0.5,0.7と比較してモデル精度が12〜45%向上した。
論文 参考訳(メタデータ) (2020-12-28T15:40:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。