論文の概要: Towards Reliable Testing of Machine Unlearning
- arxiv url: http://arxiv.org/abs/2604.16536v1
- Date: Thu, 16 Apr 2026 21:01:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.058305
- Title: Towards Reliable Testing of Machine Unlearning
- Title(参考訳): マシン・アンラーニングの信頼性テストに向けて
- Authors: Anna Mazhar, Sainyam Galhotra,
- Abstract要約: 機械学習コンポーネントはAIに注入されたソフトウェアシステムの中心である。
フルリトレーニングの代替手段として、機械学習が登場している。
本稿では,ソフトウェア工学の第一級問題として,アンラーニングテストの枠組みについて述べる。
- 参考スコア(独自算出の注目度): 9.923981046985771
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning components are now central to AI-infused software systems, from recommendations and code assistants to clinical decision support. As regulations and governance frameworks increasingly require deleting sensitive data from deployed models, machine unlearning is emerging as a practical alternative to full retraining. However, unlearning introduces a software quality-assurance challenge: under realistic deployment constraints and imperfect oracles, how can we test that a model no longer relies on targeted information? This paper frames unlearning testing as a first-class software engineering problem. We argue that practical unlearning tests must provide (i) thorough coverage over proxy and mediated influence pathways, (ii) debuggable diagnostics that localize where leakage persists, (iii) cost-effective regression-style execution under query budgets, and (iv) black-box applicability for API-deployed models. We outline a causal, pathway-centric perspective, causal fuzzing, that generates budgeted interventions to estimate residual direct and indirect effects and produce actionable "leakage reports". Proof-of-concept results illustrate that standard attribution checks can miss residual influence due to proxy pathways, cancellation effects, and subgroup masking, motivating causal testing as a promising direction for unlearning testing.
- Abstract(参考訳): 機械学習コンポーネントは、リコメンデーションやコードアシスタントから臨床決定サポートまで、AIに注入されたソフトウェアシステムの中心となっている。
規制やガバナンスのフレームワークでは、デプロイされたモデルから機密データを削除する必要がますます高まっているため、マシンラーニングは完全なリトレーニングの代替手段として現実的な存在になりつつある。
しかし、アンラーニングでは、ソフトウェアの品質保証の課題が紹介されている。現実的なデプロイメントの制約と不完全なオーラクルの下で、モデルがもはやターゲットとする情報に依存しないことをテストするにはどうすればよいのか?
本稿では,ソフトウェア工学の第一級問題として,アンラーニングテストの枠組みについて述べる。
私たちは、実践的な未学習テストは提供しなければならないと論じる
一 代理及び媒介する影響経路を徹底的に網羅すること。
(ii)漏洩が持続する場所をローカライズするデバッグ可能な診断方法
三 照会予算による費用対効果レグレッション方式の実行
(iv)APIデプロイモデルのブラックボックス適用性。
我々は、因果的、経路中心の視点、因果的ファジィングを概説し、残余の直接的および間接的効果を推定し、実行可能な「推論レポート」を作成するために予算化された介入を生成する。
Proof-of-Conceptの結果は、標準属性チェックがプロキシパス、キャンセル効果、サブグループマスキングによる残差の影響を見逃し、因果テストが未学習テストの有望な方向であることを示している。
関連論文リスト
- Scalable and Robust LLM Unlearning by Correcting Responses with Retrieved Exclusions [49.55618517046225]
Webスケールのコーパスリスクを記憶し、センシティブな情報を暴露する言語モデル。
本稿では,新しいアンラーニングフレームワークであるCorrective Unlearning with Retrieved Exclusions (CURE)を提案する。
CUREは、リークのモデル出力を確認し、安全な応答に修正する。
論文 参考訳(メタデータ) (2025-09-30T09:07:45Z) - Towards a more realistic evaluation of machine learning models for bearing fault diagnosis [0.28873930745906956]
本稿では,振動を用いた軸受故障診断におけるデータ漏洩問題とそのモデル評価への影響について検討する。
本研究では, 軸受データ分割に着目したリークフリー評価手法を提案し, トレーニングやテストに使用する物理部品の重複を防止した。
CWRU、パダーボーン大学(PU)、オタワ大学(UORED-VAF)の3つの広く採用されているデータセットに対する方法論の評価を行った。
論文 参考訳(メタデータ) (2025-09-26T12:35:02Z) - From Physics to Machine Learning and Back: Part II - Learning and Observational Bias in PHM [52.64097278841485]
物理インフォームドモデリングとデータストラテジーによる学習と観察バイアスの導入は、モデルを物理的に一貫した信頼性のある予測へと導くことができるかを検討する。
メタラーニングや少数ショットラーニングなどの高速適応手法をドメイン一般化手法とともに検討する。
論文 参考訳(メタデータ) (2025-09-25T14:15:43Z) - Causal Fuzzing for Verifying Machine Unlearning [9.923981046985771]
CAF'Eは、ブラックボックスMLモデルの検証のために、データポイントとフィーチャーレベルのアンラーニングを統合する新しいフレームワークである。
評価の結果, CAF'Eは計算効率を保ちながら, ベースラインに欠落した残差を検出できた。
論文 参考訳(メタデータ) (2025-09-20T04:19:37Z) - Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.40798352740857]
3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。
知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。
Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。
イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文 参考訳(メタデータ) (2024-07-25T07:09:35Z) - Silver Linings in the Shadows: Harnessing Membership Inference for Machine Unlearning [7.557226714828334]
ニューラルネットワークから特定のデータサンプルの影響を除去する新しい学習機構を提案する。
この目的を達成するために、我々は、ターゲットモデルの重みやアクティベーション値からプライバシーに敏感な情報を排除するための、新しい損失関数を構築した。
本研究の結果は,未学習の有効性とレイテンシ,および主課題の忠実度の観点から,我々のアプローチの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-07-01T00:20:26Z) - Towards Effective Evaluations and Comparisons for LLM Unlearning Methods [97.2995389188179]
本稿では,大規模言語モデルにおける機械学習評価の精度向上を図る。
評価指標の堅牢性と、競合する目標間のトレードオフという、2つの重要な課題に対処します。
論文 参考訳(メタデータ) (2024-06-13T14:41:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。