論文の概要: Enhancing Decision-Making in Windows PE Malware Classification During Dataset Shifts with Uncertainty Estimation
- arxiv url: http://arxiv.org/abs/2512.18495v1
- Date: Sat, 20 Dec 2025 20:17:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.36589
- Title: Enhancing Decision-Making in Windows PE Malware Classification During Dataset Shifts with Uncertainty Estimation
- Title(参考訳): 不確実性推定を伴うデータセットシフト時のWindows PEマルウェア分類における決定処理の強化
- Authors: Rahul Yumlembam, Biju Issac, Seibu Mary Jacob,
- Abstract要約: 我々は,確率閾値,事前ネット,アンサンブル推定,帰納的等式評価(ICE)を含む不確実性を考慮した意思決定戦略について検討する。
本研究の主な貢献は,ICE内における非整合性対策として,アンサンブルに基づく不確実性推定を,新しいしきい値最適化法と組み合わせることである。
これらの結果は、アンサンブルに基づく不確実性と整合性予測を統合することで、極端なデータセットシフトの下での誤分類に対するより信頼性の高い保護が可能になることを示している。
- 参考スコア(独自算出の注目度): 1.9269719158344512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence techniques have achieved strong performance in classifying Windows Portable Executable (PE) malware, but their reliability often degrades under dataset shifts, leading to misclassifications with severe security consequences. To address this, we enhance an existing LightGBM (LGBM) malware detector by integrating Neural Networks (NN), PriorNet, and Neural Network Ensembles, evaluated across three benchmark datasets: EMBER, BODMAS, and UCSB. The UCSB dataset, composed mainly of packed malware, introduces a substantial distributional shift relative to EMBER and BODMAS, making it a challenging testbed for robustness. We study uncertainty-aware decision strategies, including probability thresholding, PriorNet, ensemble-derived estimates, and Inductive Conformal Evaluation (ICE). Our main contribution is the use of ensemble-based uncertainty estimates as Non-Conformity Measures within ICE, combined with a novel threshold optimisation method. On the UCSB dataset, where the shift is most severe, the state-of-the-art probability-based ICE (SOTA) yields an incorrect acceptance rate (IA%) of 22.8%. In contrast, our method reduces this to 16% a relative reduction of about 30% while maintaining competitive correct acceptance rates (CA%). These results demonstrate that integrating ensemble-based uncertainty with conformal prediction provides a more reliable safeguard against misclassifications under extreme dataset shifts, particularly in the presence of packed malware, thereby offering practical benefits for real-world security operations.
- Abstract(参考訳): 人工知能技術は、Windows Portable Executable (PE)マルウェアの分類において強力なパフォーマンスを達成したが、その信頼性はしばしばデータセットシフトによって低下し、重大なセキュリティ上の影響を伴う誤分類につながる。
そこで我々は,ニューラルネットワーク(NN),プリミティブネット,ニューラルネットワークアンサンブルを統合し,EMBER,BODMAS,UCSBの3つのベンチマークデータセットから評価した。
UCSBデータセットは、主に満員のマルウェアで構成されており、EMBERやBODMASと比較してかなりの分布シフトを導入しており、堅牢性のテストベッドとして難しい。
本研究では,確率閾値,事前ネット,アンサンブル推定,帰納的等式評価(ICE)など,不確実性を考慮した意思決定戦略について検討する。
本研究の主な貢献は,ICE内における非整合性対策として,アンサンブルに基づく不確実性推定を,新しいしきい値最適化法と組み合わせることである。
シフトが最も深刻であるUCSBデータセットでは、最先端の確率ベースICE(SOTA)が22.8%の誤った受け入れ率(IA%)を得る。
一方, 本手法では, 競合的正受率(CA%)を維持しながら, 約30%の相対的減少率を16%に削減する。
これらの結果は、アンサンブルに基づく不確実性と整合性予測を統合することにより、極端なデータセットシフト、特に満員のマルウェアの存在下での誤分類に対するより信頼性の高い保護が実現され、現実のセキュリティ運用に実用的なメリットが提供されることを示している。
関連論文リスト
- Confidence-Based Response Abstinence: Improving LLM Trustworthiness via Activation-Based Uncertainty Estimation [7.3923284353934875]
本稿では,大規模言語モデル(LLM)出力の正しさと密接に一致したRAGシステムにおける信頼度推定手法を提案する。
提案手法は、生のフィードフォワードネットワーク(FFN)を自己回帰信号として活用することにより、事前の不確実性定量化手法を拡張した。
我々の結果は、アクティベーションに基づく信頼度モデリングが、信頼性の高いRAGデプロイメントへのスケーラブルでアーキテクチャを意識したパスを提供することを示した。
論文 参考訳(メタデータ) (2025-10-15T16:55:56Z) - Extracting Uncertainty Estimates from Mixtures of Experts for Semantic Segmentation [9.817102014355617]
アーキテクチャ変更を伴わない専門家(MoE)の混合から、よく校正された予測不確実性推定が抽出可能であることを示す。
以上の結果から,MoEsは条件付き正当性測定値において,アンサンブルよりも信頼性の高い不確実性推定値が得られることがわかった。
Cityscapesデータセットの実験では、専門家の数が増加することで不確実性の校正がさらに高められることが示唆された。
論文 参考訳(メタデータ) (2025-09-05T05:30:53Z) - Enhancing Monte Carlo Dropout Performance for Uncertainty Quantification [5.41721607488562]
ディープニューラルネットワークの出力に関連する不確実性を知ることは、信頼できる決定を行う上で最重要となる。
我々は,モンテカルロ・ドロップアウト(MCD)を,異なる検索ソリューションを統合することで拡張する革新的なフレームワークを紹介する。
提案手法は,従来の精度と不確実性の両方の観点から,平均2-3%のMCDベースラインを上回ります。
これらの結果は、安全クリティカルなアプリケーションにおけるディープラーニングモデルの信頼性を高めるためのアプローチの可能性を強調している。
論文 参考訳(メタデータ) (2025-05-21T15:50:03Z) - Certifiably Byzantine-Robust Federated Conformal Prediction [49.23374238798428]
本稿では,悪意のあるクライアントに対する堅牢な共形予測を行う新しいフレームワークRob-FCPを提案する。
我々は、さまざまなビザンチン攻撃の下で、悪意のあるクライアントの多様な割合に対するRob-FCPの堅牢性を実証的に実証した。
論文 参考訳(メタデータ) (2024-06-04T04:43:30Z) - Enhancing Reliability of Neural Networks at the Edge: Inverted
Normalization with Stochastic Affine Transformations [0.22499166814992438]
インメモリコンピューティングアーキテクチャに実装されたBayNNのロバスト性と推論精度を本質的に向上する手法を提案する。
実証的な結果は推論精度の優雅な低下を示し、最大で58.11%の値で改善された。
論文 参考訳(メタデータ) (2024-01-23T00:27:31Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。