Fugu-MT 論文翻訳(概要): Preventing Catastrophic Overfitting in Fast Adversarial Training: A Bi-level Optimization Perspective

論文の概要: Preventing Catastrophic Overfitting in Fast Adversarial Training: A Bi-level Optimization Perspective

arxiv url: http://arxiv.org/abs/2407.12443v1
Date: Wed, 17 Jul 2024 09:53:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-18 17:37:53.489799
Title: Preventing Catastrophic Overfitting in Fast Adversarial Training: A Bi-level Optimization Perspective
Title（参考訳）: 高速対人訓練における破滅的オーバーフィッティングの防止:二段階最適化の視点から
Authors: Zhaoxin Wang, Handing Wang, Cong Tian, Yaochu Jin,
Abstract要約: 対人訓練(AT)は、敵例(AE)に対する効果的な防御方法となっている。 Fast AT (FAT) はトレーニングプロセスのガイドに単一ステップの攻撃戦略を採用している。 FAT法は破滅的なオーバーフィッティング問題に悩まされる。
参考スコア（独自算出の注目度）: 20.99874786089634
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Adversarial training (AT) has become an effective defense method against adversarial examples (AEs) and it is typically framed as a bi-level optimization problem. Among various AT methods, fast AT (FAT), which employs a single-step attack strategy to guide the training process, can achieve good robustness against adversarial attacks at a low cost. However, FAT methods suffer from the catastrophic overfitting problem, especially on complex tasks or with large-parameter models. In this work, we propose a FAT method termed FGSM-PCO, which mitigates catastrophic overfitting by averting the collapse of the inner optimization problem in the bi-level optimization process. FGSM-PCO generates current-stage AEs from the historical AEs and incorporates them into the training process using an adaptive mechanism. This mechanism determines an appropriate fusion ratio according to the performance of the AEs on the training model. Coupled with a loss function tailored to the training framework, FGSM-PCO can alleviate catastrophic overfitting and help the recovery of an overfitted model to effective training. We evaluate our algorithm across three models and three datasets to validate its effectiveness. Comparative empirical studies against other FAT algorithms demonstrate that our proposed method effectively addresses unresolved overfitting issues in existing algorithms.
Abstract（参考訳）: 対戦訓練(AT)は、敵の例(AE)に対する効果的な防御方法となり、通常は二段階最適化問題として扱われる。様々なAT手法の中で、訓練プロセスの指導に一段攻撃戦略を用いる高速AT(FAT)は、低コストで敵攻撃に対して良好な堅牢性を実現することができる。しかし、FAT法は、特に複雑なタスクや大規模パラメーターモデルにおいて、破滅的なオーバーフィッティング問題に悩まされる。本研究では,FGSM-PCOと呼ばれるFAT法を提案し,二段階最適化プロセスにおける内部最適化問題の崩壊を回避し,破滅的なオーバーフィッティングを緩和する。 FGSM-PCOは、過去のAEから現在段階のAEを生成し、適応機構を用いてトレーニングプロセスに組み込む。この機構は、トレーニングモデル上でのAEの性能に応じて適切な融合比を決定する。トレーニングフレームワークに合わせた損失関数と組み合わせることで、FGSM-PCOは破滅的なオーバーフィッティングを軽減し、過剰フィッティングモデルの回復を効果的に行うことができる。 3つのモデルと3つのデータセットにまたがってアルゴリズムを評価し,その有効性を検証した。他のFATアルゴリズムとの比較実験により,提案手法は既存アルゴリズムの未解決オーバーフィッティング問題に効果的に対処できることを示した。

関連論文リスト

The Power of Many: Synergistic Unification of Diverse Augmentations for Efficient Adversarial Robustness [6.471349369877151]
敵対的摂動はディープラーニングモデルに重大な脅威をもたらす。対人訓練(AT)は、高い計算コストと標準性能の低下という課題に直面している。本稿では,そのプラグ・アンド・プレイ特性とトレーニング効率を特徴とするユニバーサル・アドバーサリアル・オーグメンタ(UAA)フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-05T08:42:14Z)
Dynamic Epsilon Scheduling: A Multi-Factor Adaptive Perturbation Budget for Adversarial Training [1.5558386948322986]
敵のトレーニングは、敵の例からニューラルネットワークを守るための最も効果的な戦略の1つである。既存の敵の訓練アプローチは固定的な摂動予算に依存しており、堅牢性に特有な特性を考慮できない。本研究では,動的Epsilon Scheduling(DES)を提案する。このフレームワークは,インスタンスごとの対向摂動予算を適応的に調整し,トレーニングインスタンス毎に調整する。
論文参考訳（メタデータ） (2025-06-03T04:18:53Z)
Leveraging Stochastic Depth Training for Adaptive Inference [1.996143466020199]
本稿では,ゼロオーバーヘッド,単一モデル,時間予測可能な推論を用いた適応推論の簡易かつ効果的な代替手法を提案する。従来のResNetと比較して、精度0.71%の低下で最大2倍の効率向上を実現した。
論文参考訳（メタデータ） (2025-05-23T08:36:56Z)
Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文参考訳（メタデータ） (2025-05-13T16:47:00Z)
Outlier-aware Tensor Robust Principal Component Analysis with Self-guided Data Augmentation [21.981038455329013]
適応重み付けを用いた自己誘導型データ拡張手法を提案する。本研究では,最先端手法と比較して精度と計算効率の両面での改善を示す。
論文参考訳（メタデータ） (2025-04-25T13:03:35Z)
A Triple-Inertial Accelerated Alternating Optimization Method for Deep Learning Training [3.246129789918632]
勾配降下法(SGD)アルゴリズムは、ディープラーニングモデルのトレーニングにおいて顕著な成功を収めた。モデルトレーニングの有望な代替手段として、交代最小化(AM)メソッドが登場した。本稿では,ニューラルネットワークトレーニングのための新しいTriple-Inertial Accelerated Alternating Minimization(TIAM)フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-11T14:42:17Z)
Fine Tuning without Catastrophic Forgetting via Selective Low Rank Adaptation [13.084333776247743]
微調整は分散シフトに対する堅牢性を低下させ、アウト・オブ・ディストリビューション(OOD)のパフォーマンスに影響を及ぼす。本稿では,低ランク適応(LoRA)ブロックを選択的に活性化するインジケータ関数を用いたパラメータ効率細調整(PEFT)手法を提案する。有効微調整は5%のアクティブブロックで実現でき、効率が大幅に向上することを示した。
論文参考訳（メタデータ） (2025-01-26T03:22:22Z)
Efficient Adversarial Training in LLMs with Continuous Attacks [99.5882845458567]
大規模言語モデル(LLM)は、安全ガードレールをバイパスできる敵攻撃に対して脆弱である。本稿では,2つの損失からなる高速対向訓練アルゴリズム(C-AdvUL)を提案する。 C-AdvIPOは、対向的に堅牢なアライメントのためのユーティリティデータを必要としない、対向型のIPOである。
論文参考訳（メタデータ） (2024-05-24T14:20:09Z)
Reducing Adversarial Training Cost with Gradient Approximation [0.3916094706589679]
そこで本研究では,厳密なモデル構築に要するコストを削減するために,GAAT(グラディエント近似)を用いた対戦訓練法を提案する。提案手法は,データセット上でのモデルテスト精度に比較して,トレーニング時間の最大60%を節約する。
論文参考訳（メタデータ） (2023-09-18T03:55:41Z)
Improving Fast Adversarial Training with Prior-Guided Knowledge [80.52575209189365]
本研究では,標準的な対人訓練と高速対人訓練の訓練過程を比較して,対人具体的品質と破滅的オーバーフィッティングの関係について検討した。その結果,敵対例の攻撃成功率が悪化すると,破滅的なオーバーフィッティングが発生することがわかった。
論文参考訳（メタデータ） (2023-04-01T02:18:12Z)
Prior-Guided Adversarial Initialization for Fast Adversarial Training [84.56377396106447]
本稿では,FAT(Fast Adversarial Training)とSAT(Standard Adversarial Training)の違いについて検討する。 FATの攻撃成功率(AE)は、後期訓練段階で徐々に悪化し、過度に適合する。本報告では, オーバーフィッティングを回避するために, 事前誘導FGSM初期化手法を提案する。提案手法は, 破滅的な過度適合を防止し, 最先端のFAT法より優れる。
論文参考訳（メタデータ） (2022-07-18T18:13:10Z)
Revisiting and Advancing Fast Adversarial Training Through The Lens of Bi-Level Optimization [60.72410937614299]
提案手法は,2レベルAT(FAST-BAT)と呼ばれる新しいアルゴリズムセットの設計と解析である。 FAST-BATは、グラデーションサインメソッドや明示的なロバスト正規化を呼ぶことなく、符号ベースの投射降下(PGD)攻撃を防御することができる。
論文参考訳（メタデータ） (2021-12-23T06:25:36Z)
Boosting Adversarial Training with Hypersphere Embedding [53.75693100495097]
敵対的訓練は、ディープラーニングモデルに対する敵対的攻撃に対する最も効果的な防御の1つである。本研究では,超球埋め込み機構をATプロシージャに組み込むことを提唱する。我々は,CIFAR-10 と ImageNet データセットに対する幅広い敵対攻撃の下で本手法を検証した。
論文参考訳（メタデータ） (2020-02-20T08:42:29Z)
Adversarial Distributional Training for Robust Deep Learning [53.300984501078126]
逆行訓練(AT)は、逆行例によるトレーニングデータを増やすことにより、モデルロバスト性を改善する最も効果的な手法の一つである。既存のAT手法の多くは、敵の例を作らせるために特定の攻撃を採用しており、他の目に見えない攻撃に対する信頼性の低い堅牢性につながっている。本稿では,ロバストモデル学習のための新しいフレームワークであるADTを紹介する。
論文参考訳（メタデータ） (2020-02-14T12:36:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。