論文の概要: Don't Break the Boundary: Continual Unlearning for OOD Detection Based on Free Energy Repulsion
- arxiv url: http://arxiv.org/abs/2602.06331v1
- Date: Fri, 06 Feb 2026 02:55:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.200235
- Title: Don't Break the Boundary: Continual Unlearning for OOD Detection Based on Free Energy Repulsion
- Title(参考訳): 境界線を破らない:自由エネルギー反発に基づくOOD検出のための連続的アンラーニング
- Authors: Ningkang Peng, Kun Shao, Jingyang Mao, Linjing Qian, Xiaoqian Peng, Xichen Yang, Yanhui Gu,
- Abstract要約: アウト・オブ・ディストリビューション(OOD)検出は、オープンワールド環境における信頼できるAIにとって不可欠である。
従来のアンラーニング手法は、この微妙な構造を妨害し、異常を識別するモデルの能力が壊滅的に失われた。
我々は,低エネルギーID多様体内の保持クラスをプル機構を介してアンカーし,忘れられたクラスを高エネルギーOOD領域に積極的に排出するTFERを提案する。
- 参考スコア(独自算出の注目度): 8.714183507567087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying trustworthy AI in open-world environments faces a dual challenge: the necessity for robust Out-of-Distribution (OOD) detection to ensure system safety, and the demand for flexible machine unlearning to satisfy privacy compliance and model rectification. However, this objective encounters a fundamental geometric contradiction: current OOD detectors rely on a static and compact data manifold, whereas traditional classification-oriented unlearning methods disrupt this delicate structure, leading to a catastrophic loss of the model's capability to discriminate anomalies while erasing target classes. To resolve this dilemma, we first define the problem of boundary-preserving class unlearning and propose a pivotal conceptual shift: in the context of OOD detection, effective unlearning is mathematically equivalent to transforming the target class into OOD samples. Based on this, we propose the TFER (Total Free Energy Repulsion) framework. Inspired by the free energy principle, TFER constructs a novel Push-Pull game mechanism: it anchors retained classes within a low-energy ID manifold through a pull mechanism, while actively expelling forgotten classes to high-energy OOD regions using a free energy repulsion force. This approach is implemented via parameter-efficient fine-tuning, circumventing the prohibitive cost of full retraining. Extensive experiments demonstrate that TFER achieves precise unlearning while maximally preserving the model's discriminative performance on remaining classes and external OOD data. More importantly, our study reveals that the unique Push-Pull equilibrium of TFER endows the model with inherent structural stability, allowing it to effectively resist catastrophic forgetting without complex additional constraints, thereby demonstrating exceptional potential in continual unlearning tasks.
- Abstract(参考訳): システムの安全性を保証するための堅牢なアウト・オブ・ディストリビューション(OOD)検出の必要性と、プライバシのコンプライアンスとモデルの修正を満足するフレキシブルなマシンアンラーニングの必要性。
しかし、この目的は基本的な幾何学的矛盾に直面する: 現在のOOD検出器は静的でコンパクトなデータ多様体に依存しているのに対し、従来の分類指向の未学習法はこの微妙な構造を妨害し、ターゲットクラスを消去しながら異常を識別するモデルの能力が壊滅的に失われる。
このジレンマを解決するために、まず境界保存クラスアンラーニングの問題を定義し、重要な概念シフトを提案する。OOD検出の文脈では、効果的なアンラーニングは、ターゲットクラスをOODサンプルに変換するのと数学的に等価である。
そこで我々はTFER(Total Free Energy Repulsion)フレームワークを提案する。
自由エネルギー原理にインスパイアされたTFERは、新しいPush-Pullゲーム機構を構築し、プル機構を通じて低エネルギーID多様体内の保持クラスをアンカーすると同時に、自由エネルギー反発力を用いて、忘れられたクラスを高エネルギーOD領域に積極的に排出する。
このアプローチはパラメータ効率の良い微調整によって実装され、完全再トレーニングの禁止コストを回避する。
大規模な実験により、TFERはモデルが残っていたクラスと外部のOODデータに対して識別性能を最大に保ちながら、正確な未学習を実現することが示された。
さらに,本研究では,TFERのPush-Pull平衡に固有の構造安定性を付与し,複雑な追加制約を伴わずに破滅的忘れを効果的に抑制し,連続的未学習タスクにおいて異常な可能性を示すことを明らかにした。
関連論文リスト
- Representation-Aware Unlearning via Activation Signatures: From Suppression to Knowledge-Signature Erasure [2.0017902634527194]
本稿では,真の消去と難読化を区別する表現対応アーキテクチャであるKnowledge Immunization Framework(KIF)を紹介する。
提案手法は,主観的表現の動的抑制とパラメータ効率の適応を組み合わせ,完全モデル再学習を伴わない耐久性のある未学習を実現する。
論文 参考訳(メタデータ) (2026-01-15T16:28:14Z) - LEGATO: Good Identity Unlearning Is Continuous [30.78585550012454]
LEGATOは、生成モデルのアイデンティティを忘れることを学ぶための機械学習手法である。
最先端の忘れパフォーマンスを実現し、破滅的な崩壊を回避し、微調整されたパラメータを減らす。
実験の結果,LEGATOは最先端の忘れ物性能を実現し,破滅的な崩壊を回避し,微調整パラメータを低減できることがわかった。
論文 参考訳(メタデータ) (2026-01-07T13:15:25Z) - Relative Energy Learning for LiDAR Out-of-Distribution Detection [2.9740664660400804]
アウト・オブ・ディストリビューション(OOD)検出は信頼性の高い自動運転にとって重要な要件である。
我々は,LiDAR点雲におけるOOD検出のためのフレームワークであるRelative Energy Learning (REL)を提案する。
トレーニング中のOODサンプルの欠如に対処するため,ポイントゲインと呼ばれる軽量なデータ合成戦略を提案する。
論文 参考訳(メタデータ) (2025-11-10T05:29:18Z) - ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [51.07970070817353]
理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。
現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。
本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文 参考訳(メタデータ) (2025-08-19T12:13:41Z) - MISLEADER: Defending against Model Extraction with Ensembles of Distilled Models [56.09354775405601]
モデル抽出攻撃は、クエリアクセスを通じてブラックボックスモデルの機能を複製することを目的としている。
既存のディフェンスでは、アタッカークエリにはオフ・オブ・ディストリビューション(OOD)サンプルがあることを前提としており、不審な入力を検出し破壊することができる。
OOD仮定に依存しない新しい防衛戦略であるMISLEADERを提案する。
論文 参考訳(メタデータ) (2025-06-03T01:37:09Z) - HUWSOD: Holistic Self-training for Unified Weakly Supervised Object Detection [66.42229859018775]
我々は,HUWSOD(HuWSOD)と呼ばれる,統一・高容量弱教師付きオブジェクト検出(WSOD)ネットワークを導入する。
HUWSODには、自己管理された提案生成器と、従来のオブジェクト提案を置き換えるために、マルチレートで再構成されたピラミッドを備えたオートエンコーダ提案生成器が組み込まれている。
提案手法は,よく設計されたオフラインオブジェクト提案と大きく異なるが,WSOD訓練には有効であることを示す。
論文 参考訳(メタデータ) (2024-06-27T17:59:49Z) - A Unified Contrastive Energy-based Model for Understanding the
Generative Ability of Adversarial Training [64.71254710803368]
Adversarial Training (AT) は、ディープニューラルネットワークの堅牢性を高める効果的なアプローチである。
我々は、Contrastive Energy-based Models(CEM)と呼ばれる統合確率的枠組みを開発することにより、この現象をデミステレーションする。
本稿では,逆学習法とサンプリング法を開発するための原則的手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T05:33:34Z) - Weakly Supervised Semantic Segmentation via Alternative Self-Dual
Teaching [82.71578668091914]
本稿では,分類とマスク・リファインメント・コンポーネントを統合された深層モデルに組み込む,コンパクトな学習フレームワークを確立する。
本稿では,高品質な知識相互作用を促進するために,新たな自己双対学習(ASDT)機構を提案する。
論文 参考訳(メタデータ) (2021-12-17T11:56:56Z) - Policy Smoothing for Provably Robust Reinforcement Learning [109.90239627115336]
入力のノルム有界対向摂動に対する強化学習の証明可能な堅牢性について検討する。
我々は、スムーズなポリシーによって得られる全報酬が、入力の摂動のノルムバウンドな逆数の下で一定の閾値以下に収まらないことを保証した証明書を生成する。
論文 参考訳(メタデータ) (2021-06-21T21:42:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。