論文の概要: Privacy-Aware Machine Unlearning with SISA for Reinforcement Learning-Based Ransomware Detection
- arxiv url: http://arxiv.org/abs/2604.16760v1
- Date: Sat, 18 Apr 2026 00:19:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 14:07:29.256292
- Title: Privacy-Aware Machine Unlearning with SISA for Reinforcement Learning-Based Ransomware Detection
- Title(参考訳): 強化学習に基づくランサムウェア検出のためのSISAを用いたプライバシ・アウェア・マシン・アンラーニング
- Authors: Jannatul Ferdous, Rafiqul Islam, Md Zahidul Islam,
- Abstract要約: 本稿では、Sharded, Isolated, Sliced, Aggregated trainingをベースとしたランサムウェア検出のための、プライバシを意識しない機械学習評価フレームワークを提案する。
このフレームワークは、検出器全体ではなく、影響を受けるモデルのシャードのみをトレーニングすることで、効率的なデータ削除を可能にする。
- 参考スコア(独自算出の注目度): 1.8024397171920885
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Ransomware detection systems increasingly rely on behavior-based machine learning to address evolving attack strategies. However, emerging privacy compliance, data governance, and responsible AI deployment demand not only accurate detection but also the ability to efficiently remove the influence of specific training samples without retraining the models from scratch. In this study, we present a privacy-aware machine unlearning evaluation framework for reinforcement learning (RL)-based ransomware detection built on Sharded, Isolated, Sliced, and Aggregated (SISA) training. The framework enables efficient data deletion by retraining only the affected model shards rather than the entire detector, reducing the retraining cost while preserving detection performance. We conduct a controlled comparative study using value-based RL agents, including Deep Q-Network (DQN) and Double Deep Q-Network (DDQN), under identical experimental settings with a cost-sensitive reward design and 5-fold cross-validation on Windows 11 ransomware dataset. Detection confidence is evaluated using a continuous Q-score margin, enabling ROC-AUC analysis beyond binary predictions. For unlearning, the dataset is partitioned into five shards with majority-vote aggregation, and a fast-unlearning path is evaluated by deleting 5% of the samples from a single shard and retraining only that shard. Results show that SISA-based unlearning incurs negligible utility degradation (<= 0.05 percent F1 drop) while substantially reducing retraining time relative to full SISA retraining. DDQN exhibits slightly improved stability and lower utility loss than DQN, while both agents maintain near identical in-distribution performance after unlearning. These findings indicate that SISA provides an efficient unlearning mechanism for RL-based ransomware detection, supporting privacy-aware deployment without compromising security effectiveness.
- Abstract(参考訳): ランサムウェア検出システムは、進化する攻撃戦略に対処するために、行動に基づく機械学習にますます依存している。
しかしながら、プライバシコンプライアンスの出現、データガバナンス、責任あるAIデプロイメントは、正確な検出だけでなく、モデルをスクラッチからトレーニングすることなく、特定のトレーニングサンプルの影響を効率的に除去する能力も要求している。
本研究では,Sharded,Isolated,Sliced,Aggregated(SISA)トレーニングをベースとした強化学習(RL)に基づくランサムウェア検出のための,プライバシを意識しない機械学習評価フレームワークを提案する。
このフレームワークは、影響を受けるモデルシャードのみを検出器全体ではなく再トレーニングすることで、効率的なデータ削除を可能にし、検出性能を維持しつつ、再トレーニングコストを低減させる。
我々は,DQN(Deep Q-Network)やDouble Deep Q-Network(Double Deep Q-Network)などの値ベースのRLエージェントを用いて,コスト感受性の報酬設計とWindows 11ランサムウェアデータセット上の5倍のクロスバリデーションを備えた同じ実験環境下で,制御された比較研究を行う。
検出信頼度は連続したQスコアマージンを用いて評価され、2進予測を超えたROC-AUC分析が可能となる。
アンラーニングでは、データセットは5つのシャードに分割され、多数決で集約され、高速なアンラーニングパスは、サンプルの5%を単一のシャードから削除し、そのシャードのみを再トレーニングすることで評価される。
その結果,SISAをベースとした未学習は実用性低下(=0.05%F1ドロップ)を招き,SISAの再トレーニングに対する再トレーニング時間を大幅に短縮することがわかった。
DDQNはDQNよりも安定性がわずかに向上し、ユーティリティ損失も低かった。
これらの結果から,SISA は RL ベースのランサムウェア検出のための効率的なアンラーニング機構を提供し,セキュリティ効果を損なうことなく,プライバシを意識したデプロイメントを支援することが示唆された。
関連論文リスト
- Tracing the Chain: Deep Learning for Stepping-Stone Intrusion Detection [7.981257687111937]
ステッピングストーン侵入(SSI)は一般的なネットワーク回避手法である。
効果的なSSI検出には、各リレーホストの入出力フローを極めて低い偽陽性率で関連付ける必要がある。
ESPRESSOは、トランスフォーマーベースの特徴抽出ネットワーク、タイムアラインな多チャンネル間隔特徴、オンライントリプレットメトリック学習を組み合わせたフロー相関モデルである。
論文 参考訳(メタデータ) (2026-04-09T22:26:52Z) - SCOPED: Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion [5.008779702997125]
アウト・オブ・ディストリビューション(OOD)検出は、視覚、ロボット工学、強化学習などにおける機械学習システムの信頼性の高い展開に不可欠である。
SCOPED(Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion)を紹介する。
SCOPEDは、多様なデータセットでトレーニングされた単一の拡散モデルから計算され、モデルのスコア関数のジャコビアントレースと2乗ノルムを単一のテスト統計量に結合する。
4つのビジョンベンチマークでは、SCOPEDは計算コストの低いにもかかわらず、競合または最先端の精度リコールスコアを達成している。
論文 参考訳(メタデータ) (2025-10-01T20:54:49Z) - TraceHiding: Scalable Machine Unlearning for Mobility Data [1.6042394978941517]
TraceHidingは、移動軌道データのためのスケーラブルで重要な機械学習フレームワークである。
トレーニングされたディープモデルから特定のユーザトラジェクトリを、フルリトレーニングなしで削除する。
非学習精度が向上し、MIAレジリエンスが向上し、リトレーニングよりも最大40倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2025-09-21T21:29:24Z) - Lie Detector: Unified Backdoor Detection via Cross-Examination Framework [68.45399098884364]
半正直な設定で一貫したバックドア検出フレームワークを提案する。
本手法は,SoTAベースラインよりも5.4%,1.6%,11.9%の精度で検出性能が向上する。
特に、マルチモーダルな大規模言語モデルにおいて、バックドアを効果的に検出するのは、これが初めてである。
論文 参考訳(メタデータ) (2025-03-21T06:12:06Z) - Incremental Self-training for Semi-supervised Learning [56.57057576885672]
ISTは単純だが有効であり、既存の自己学習に基づく半教師あり学習手法に適合する。
提案したISTを5つのデータセットと2種類のバックボーンで検証し,認識精度と学習速度を効果的に向上させる。
論文 参考訳(メタデータ) (2024-04-14T05:02:00Z) - Solving Offline Reinforcement Learning with Decision Tree Regression [0.0]
本研究は, オフライン強化学習問題に対して, 回帰タスクとして再検討することで, 新たなアプローチを提案する。
我々は、リターン条件付きとリターン重み付き決定ツリーポリシーの2つの異なるフレームワークを紹介します。
オフラインRLに対するこの改定されたアプローチに固有の単純化にもかかわらず、我々のエージェントは、少なくとも確立された手法と同等の性能を示す。
論文 参考訳(メタデータ) (2024-01-21T23:50:46Z) - Fast Machine Unlearning Without Retraining Through Selective Synaptic
Dampening [51.34904967046097]
Selective Synaptic Dampening (SSD)は高速で、訓練データの長期保存を必要としない。
高速で性能が高く,トレーニングデータの長期保存を必要としない,新しい2段階のポストホック,リトレーニングフリーなマシンアンラーニング手法を提案する。
論文 参考訳(メタデータ) (2023-08-15T11:30:45Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z) - Unsupervised Domain Adaptation for Speech Recognition via Uncertainty
Driven Self-Training [55.824641135682725]
WSJ をソースドメインとし,TED-Lium 3 とSWITCHBOARD を併用したドメイン適応実験を行った。
論文 参考訳(メタデータ) (2020-11-26T18:51:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。