論文の概要: Breaking the Adversarial Robustness-Performance Trade-off in Text Classification via Manifold Purification
- arxiv url: http://arxiv.org/abs/2511.07888v1
- Date: Wed, 12 Nov 2025 01:26:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.524311
- Title: Breaking the Adversarial Robustness-Performance Trade-off in Text Classification via Manifold Purification
- Title(参考訳): マニフォールド精製によるテキスト分類における対向ロバスト性-性能トレードオフの破断
- Authors: Chenhao Dang, Jing Ma,
- Abstract要約: テキスト分類(TC)における永続的な課題は、敵攻撃に対するモデル堅牢性の向上は、典型的にはクリーンデータのパフォーマンスを低下させることである。
この問題は、エンコーダ埋め込み多様体におけるクリーンサンプルの分布をモデル化することで解決できると論じる。
文の埋め込みを直接操作する2モジュールシステムであるManifold-Correcting Causal Flow (MC2F)を提案する。
- 参考スコア(独自算出の注目度): 7.908790490702219
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A persistent challenge in text classification (TC) is that enhancing model robustness against adversarial attacks typically degrades performance on clean data. We argue that this challenge can be resolved by modeling the distribution of clean samples in the encoder embedding manifold. To this end, we propose the Manifold-Correcting Causal Flow (MC^2F), a two-module system that operates directly on sentence embeddings. A Stratified Riemannian Continuous Normalizing Flow (SR-CNF) learns the density of the clean data manifold. It identifies out-of-distribution embeddings, which are then corrected by a Geodesic Purification Solver. This solver projects adversarial points back onto the learned manifold via the shortest path, restoring a clean, semantically coherent representation. We conducted extensive evaluations on text classification (TC) across three datasets and multiple adversarial attacks. The results demonstrate that our method, MC^2F, not only establishes a new state-of-the-art in adversarial robustness but also fully preserves performance on clean data, even yielding modest gains in accuracy.
- Abstract(参考訳): テキスト分類(TC)における永続的な課題は、敵攻撃に対するモデル堅牢性の向上は、典型的にはクリーンデータのパフォーマンスを低下させることである。
この問題は、エンコーダ埋め込み多様体におけるクリーンサンプルの分布をモデル化することで解決できると論じる。
この目的のために,文の埋め込みを直接操作する2モジュールシステムであるManifold-Correcting Causal Flow (MC^2F)を提案する。
成層リーマン連続正規化フロー(SR-CNF)はクリーンデータ多様体の密度を学習する。
分布外埋め込みを識別し、ジオデシック浄化ソルバーで修正する。
この解法は、最も短い経路を通して学習された多様体に逆転点を投影し、クリーンで意味論的に一貫性のある表現を復元する。
我々は3つのデータセットにまたがるテキスト分類(TC)と複数対逆攻撃について広範囲に評価を行った。
その結果, 提案手法であるMC^2Fは, 対向ロバスト性において新たな最先端性を確立するだけでなく, クリーンデータの性能を保ちつつも, 精度は適度に向上することを示した。
関連論文リスト
- Latent Iterative Refinement Flow: A Geometric-Constrained Approach for Few-Shot Generation [5.062604189239418]
少ショット生成に対する新しいアプローチであるLIRF(Latent Iterative Refinement Flow)を導入する。
LIRFは,新しいtextbfmanifold保存損失をトレーニングしたオートエンコーダを用いて,安定な潜伏空間を確立する。
このサイクルの中で、候補サンプルは幾何的テクスチャ補正演算子によって洗練される。
論文 参考訳(メタデータ) (2025-09-24T08:57:21Z) - Adversarial Purification by Consistency-aware Latent Space Optimization on Data Manifolds [48.37843602248313]
ディープニューラルネットワーク(DNN)は、クリーンデータに知覚不能な摂動を加えることで作られた敵のサンプルに対して脆弱であり、誤った危険な予測につながる可能性がある。
本稿では、事前学習された一貫性モデルの潜在空間内のベクトルを最適化し、クリーンなデータを復元するためのサンプルを生成する、一貫性モデルに基づく適応的パーフィケーション(CMAP)を提案する。
CMAPは、高い自然な精度を維持しながら、強力な敵攻撃に対する堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2024-12-11T14:14:02Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion [55.185588994883226]
VQ-LCMDは、学習を安定させる埋め込み空間内の連続空間潜在拡散フレームワークである。
VQ-LCMDは、関節埋め込み拡散変動下界と整合整合性(CM)損失を組み合わせた新しいトレーニング目標を使用する。
実験により,提案したVQ-LCMDは離散状態潜伏拡散モデルと比較して,FFHQ,LSUN教会,LSUNベッドルームにおいて優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2024-10-18T09:12:33Z) - Adversarial Vulnerability as a Consequence of On-Manifold Inseparibility [16.998477658358773]
分類タスクを考慮し,データ分布を低次元多様体として特徴付ける。
クリーントレーニングは、悪条件によるオフマニフォールド方向の収束不良を経験していると論じる。
我々は,長期トレーニングと2次手法の活用によるクリーントレーニングにおいて,実験を行い,大幅な堅牢性向上を示す。
論文 参考訳(メタデータ) (2024-10-09T14:18:52Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Diffusion Models for Adversarial Purification [69.1882221038846]
対人浄化(Adrial purification)とは、生成モデルを用いて敵の摂動を除去する防衛方法の分類である。
そこで我々は,拡散モデルを用いたDiffPureを提案する。
提案手法は,現在の対人訓練および対人浄化方法よりも優れ,最先端の成果を達成する。
論文 参考訳(メタデータ) (2022-05-16T06:03:00Z) - MMCGAN: Generative Adversarial Network with Explicit Manifold Prior [78.58159882218378]
本稿では,モード崩壊を緩和し,GANのトレーニングを安定させるために,明示的な多様体学習を採用することを提案する。
玩具データと実データの両方を用いた実験により,MMCGANのモード崩壊緩和効果,トレーニングの安定化,生成サンプルの品質向上効果が示された。
論文 参考訳(メタデータ) (2020-06-18T07:38:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。