論文の概要: Machine Unlearning for the XGBoost Model with Network Intrusion Datasets
- arxiv url: http://arxiv.org/abs/2606.19220v1
- Date: Wed, 17 Jun 2026 15:57:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.254212
- Title: Machine Unlearning for the XGBoost Model with Network Intrusion Datasets
- Title(参考訳): ネットワーク侵入データセットを用いたXGBoostモデルの機械学習
- Authors: Diana Magalhães, Eva Maia, João Vitorino, Isabel Praça,
- Abstract要約: この作業では、XGBoostモデルの未学習アプローチであるXGBoost-Forgetを導入して、このギャップに対処する。
XGBoost-Forgetは、元のモデルに近い予測性能を維持しながら、はるかに高速なアンラーニングを提供する。
- 参考スコア(独自算出の注目度): 1.423280626666929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine Unlearning (MU) has emerged as an important technique for removing specific data points from trained models without requiring full retraining. However, most existing MU research focuses on deep learning and image data, leaving a gap in the domain of network intrusion detection, which relies heavily on tabular data. This work introduces XGBoost-Forget, an unlearning approach for the XGBoost model, to address this gap. The approach is evaluated on two tabular Network Intrusion (NI) datasets, IoT-23 and GeNIS, using multiple metrics to assess model performance, unlearning efficiency, and forgetting quality. The results show that XGBoost-Forget maintains predictive performance close to the original model while providing significantly faster unlearning, demonstrating its potential for MU in tabular NI settings.
- Abstract(参考訳): マシン・アンラーニング(MU)は、トレーニングされたモデルから特定のデータポイントを、完全な再トレーニングを必要とせずに除去する重要なテクニックとして登場した。
しかし、既存のMU研究はディープラーニングと画像データに重点を置いており、グラフデータに大きく依存するネットワーク侵入検出の領域にギャップを残している。
この作業では、XGBoostモデルの未学習アプローチであるXGBoost-Forgetを導入して、このギャップに対処する。
このアプローチは、2つのテーブル形式のNetwork Intrusion(NI)データセット、IoT-23とGeNISで評価され、複数のメトリクスを使用してモデルパフォーマンス、未学習の効率、品質の忘れ方を評価する。
その結果、XGBoost-Forgetは元のモデルに近い予測性能を維持しつつ、学習の高速化を実現し、表形式のNI設定におけるMUの可能性を示した。
関連論文リスト
- IMU: Influence-guided Machine Unlearning [12.87795856802456]
マシン・アンラーニング(MU)は、要求に応じて特定のデータポイントを選択的に忘れることを可能にする。
既存のMUアルゴリズムの多くは、保持セットに部分的または完全な微調整を必要とする。
本稿では,インフルエンス誘導型機械学習(IMU)を提案する。
論文 参考訳(メタデータ) (2025-08-03T07:00:28Z) - Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - Explainable AI for Comparative Analysis of Intrusion Detection Models [20.683181384051395]
本研究は,ネットワークトラフィックから侵入検出を行うために,各種機械学習モデルを二分分類および多クラス分類のタスクに解析する。
すべてのモデルをUNSW-NB15データセットで90%の精度でトレーニングしました。
また、Random Forestは正確さ、時間効率、堅牢性という点で最高のパフォーマンスを提供します。
論文 参考訳(メタデータ) (2024-06-14T03:11:01Z) - GraphGuard: Detecting and Counteracting Training Data Misuse in Graph
Neural Networks [69.97213941893351]
グラフデータ分析におけるグラフニューラルネットワーク(GNN)の出現は、モデルトレーニング中のデータ誤用に関する重要な懸念を引き起こしている。
既存の手法は、データ誤用検出または緩和のいずれかに対応しており、主にローカルGNNモデル用に設計されている。
本稿では,これらの課題に対処するため,GraphGuardという先駆的なアプローチを導入する。
論文 参考訳(メタデータ) (2023-12-13T02:59:37Z) - Learn to Unlearn for Deep Neural Networks: Minimizing Unlearning
Interference with Gradient Projection [56.292071534857946]
最近のデータプライバシ法は、機械学習への関心を喚起している。
課題は、残りのデータセットに関する知識を変更することなく、忘れたデータに関する情報を捨てることである。
我々は、プロジェクテッド・グラディエント・アンラーニング(PGU)という、プロジェクテッド・グラディエント・ベースの学習手法を採用する。
トレーニングデータセットがもはやアクセスできない場合でも、スクラッチからスクラッチで再トレーニングされたモデルと同じような振る舞いをするモデルを、我々のアンラーニング手法が生成できることを実証するための実証的な証拠を提供する。
論文 参考訳(メタデータ) (2023-12-07T07:17:24Z) - Unlearning Graph Classifiers with Limited Data Resources [39.29148804411811]
制御されたデータ削除は、データに敏感なWebアプリケーションのための機械学習モデルの重要機能になりつつある。
グラフニューラルネットワーク(GNN)の効率的な機械学習を実現する方法はまだほとんど知られていない。
我々の主な貢献は GST に基づく非線形近似グラフアンラーニング法である。
第2の貢献は、提案した未学習機構の計算複雑性の理論解析である。
第3のコントリビューションは広範囲なシミュレーションの結果であり、削除要求毎のGNNの完全再トレーニングと比較して、新しいGSTベースのアプローチは平均10.38倍のスピードアップを提供する。
論文 参考訳(メタデータ) (2022-11-06T20:46:50Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。