Fugu-MT 論文翻訳(概要): Stratified Adversarial Robustness with Rejection

論文の概要: Stratified Adversarial Robustness with Rejection

arxiv url: http://arxiv.org/abs/2305.01139v2
Date: Fri, 12 May 2023 01:00:57 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-15 15:34:58.790594
Title: Stratified Adversarial Robustness with Rejection
Title（参考訳）: 拒絶を伴う層状対向ロバスト性
Authors: Jiefeng Chen, Jayaram Raghuram, Jihye Choi, Xi Wu, Yingyu Liang, Somesh Jha
Abstract要約: 本研究は, 階層化拒絶条件において, 否定を伴う逆ロバスト分類について検討する。我々は,一貫性予測に基づくリジェクション(CPR)を用いた対人訓練という新しい防衛手法を提案する。 CPRは、アダプティブアタックによって既存の手法よりも優れています。
参考スコア（独自算出の注目度）: 33.72077702550626
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, there is an emerging interest in adversarially training a classifier with a rejection option (also known as a selective classifier) for boosting adversarial robustness. While rejection can incur a cost in many applications, existing studies typically associate zero cost with rejecting perturbed inputs, which can result in the rejection of numerous slightly-perturbed inputs that could be correctly classified. In this work, we study adversarially-robust classification with rejection in the stratified rejection setting, where the rejection cost is modeled by rejection loss functions monotonically non-increasing in the perturbation magnitude. We theoretically analyze the stratified rejection setting and propose a novel defense method -- Adversarial Training with Consistent Prediction-based Rejection (CPR) -- for building a robust selective classifier. Experiments on image datasets demonstrate that the proposed method significantly outperforms existing methods under strong adaptive attacks. For instance, on CIFAR-10, CPR reduces the total robust loss (for different rejection losses) by at least 7.3% under both seen and unseen attacks.
Abstract（参考訳）: 近年, 対人ロバスト性を高めるために, 拒否オプション(選択分類器としても知られる)で分類器を訓練することへの関心が高まっている。拒絶は多くのアプリケーションでコストを発生させるが、既存の研究は通常、ゼロコストと摂動入力の拒絶を関連付けている。本研究は, 階層化拒絶条件において, 相対的ロバスト分類を行い, 差分損失関数を単調に非増加化させることにより, 拒絶コストをモデル化するものである。階層化拒絶設定を理論的に解析し,ロバストな選択的分類器を構築するための新しい防御法であるconsistance prediction-based reject (cpr)を提案する。画像データセット実験により,提案手法は適応攻撃の強い既存手法よりも有意に優れていた。例えば、CIFAR-10では、CPRは(異なる拒絶損失に対して)総ロバスト損失を少なくとも7.3%削減する。

関連論文リスト

TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文参考訳（メタデータ） (2025-04-20T09:20:55Z)
DataSentinel: A Game-Theoretic Detection of Prompt Injection Attacks [101.52204404377039]
LLM統合されたアプリケーションとエージェントは、インジェクション攻撃に弱い。検出方法は、入力が注入プロンプトによって汚染されているかどうかを判定することを目的とする。本研究では,迅速なインジェクション攻撃を検出するゲーム理論手法であるDataSentinelを提案する。
論文参考訳（メタデータ） (2025-04-15T16:26:21Z)
Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization [60.176008034221404]
直接選好最適化(DPO)とその変種は、言語モデルと人間の選好の整合にますます利用されている。以前の研究では、トレーニング中に好まれる反応の可能性が減少する傾向が見られた。確率変位は破滅的になりうることを示し、確率質量を好ましくない反応から反対の意味の反応へとシフトさせる。
論文参考訳（メタデータ） (2024-10-11T14:22:44Z)
Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [75.36597470578724]
敵の浄化は、敵の攻撃からニューラルネットワークを守るための有望なアプローチの1つである。分類器決定境界から遠ざかって, 清浄するgUided Purification (COUP)アルゴリズムを提案する。実験結果から, COUPは強力な攻撃法でより優れた対向的堅牢性が得られることが示された。
論文参考訳（メタデータ） (2024-08-12T02:48:00Z)
Regression with Cost-based Rejection [30.43900105405108]
本稿では, ある拒絶コストを前提として, モデルがいくつかの例で予測を下方修正できる新たな回帰問題について検討する。我々はベイズ最適解を導出し、最適モデルが拒絶コストよりも分散が大きい例について予測を下さなければならないことを示す。
論文参考訳（メタデータ） (2023-11-08T09:33:21Z)
Confidence-aware Training of Smoothed Classifiers for Certified Robustness [75.95332266383417]
我々は「ガウス雑音下での精度」を、入力に対する対角的ロバスト性の容易に計算可能なプロキシとして利用する。実験の結果, 提案手法は, 最先端の訓練手法による信頼性向上を継続的に示すことがわかった。
論文参考訳（メタデータ） (2022-12-18T03:57:12Z)
Optimal Rejection Function Meets Character Recognition Tasks [8.373151777137792]
本稿では,不明瞭なサンプルを拒絶関数で除去する最適な拒絶法を提案する。この拒絶関数はLwR(Learning-with-Rejection)の枠組みの下で分類関数と共に訓練される NotMNIST分類とキャラクタ・ノンキャラクタ分類の広範な実験により,提案手法が従来の拒絶手法よりも優れた性能を実現することを示す。
論文参考訳（メタデータ） (2022-03-17T08:14:00Z)
Adversarial Training with Rectified Rejection [114.83821848791206]
本稿では,信頼度(T-Con)を確実性オラクルとして利用し,信頼度を補正してT-Conを予測することを提案する。軽度の条件下では、正当性(R-Con)拒絶器と信頼性(R-Con)拒絶器を結合して、不正に分類された入力と正しく分類された入力を区別できることを示す。
論文参考訳（メタデータ） (2021-05-31T08:24:53Z)
Selective Probabilistic Classifier Based on Hypothesis Testing [14.695979686066066]
分類器の閉世界仮定の違反に対処するためのシンプルで効果的な方法を提案する。提案手法は確率的ネットワークを用いた仮説テストに基づく拒絶オプションである。提案手法は, より広い操作範囲を達成でき, 代替手段よりも低い偽陽性比をカバーできることが示されている。
論文参考訳（メタデータ） (2021-05-09T08:55:56Z)
ATRO: Adversarial Training with a Rejection Option [10.36668157679368]
本稿では, 逆例による性能劣化を軽減するために, 拒否オプション付き分類フレームワークを提案する。分類器と拒否関数を同時に適用することにより、テストデータポイントの分類に自信が不十分な場合に分類を控えることができる。
論文参考訳（メタデータ） (2020-10-24T14:05:03Z)
Classification with Rejection Based on Cost-sensitive Classification [83.50402803131412]
学習のアンサンブルによる拒絶を用いた新しい分類法を提案する。実験により, クリーン, ノイズ, 正の未ラベル分類における提案手法の有用性が示された。
論文参考訳（メタデータ） (2020-10-22T14:05:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。