論文の概要: Disagreement-Regularized Importance Sampling for Adversarial Label Corruption
- arxiv url: http://arxiv.org/abs/2605.07551v1
- Date: Fri, 08 May 2026 10:27:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.992519
- Title: Disagreement-Regularized Importance Sampling for Adversarial Label Corruption
- Title(参考訳): 逆行性ラベル破壊に対する診断規則化重要度サンプリング
- Authors: Csongor Horváth, Ida-Maria Sintorn, Prashant Singh,
- Abstract要約: Disagreement-Regularized Importance Smpling (DR-IS)は、独立したプロキシアンサンブル間での損失ランクの分類に基づくサブサンプリング手法である。
DR-ISは、ベンチマークデータセット上のError $L$-norm (EL2N)のようなマグニチュードベースのメソッドを壊すターゲットの高いノーム攻撃の下で堅牢である。
- 参考スコア(独自算出の注目度): 3.0416928830191066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Standard Importance Sampling (IS) collapses under label corruption because high-norm examples, prioritized for variance reduction, are often adversarial outliers. We formalize this misalignment using an $\varepsilon$-contamination model and propose Disagreement-Regularized Importance Sampling (DR-IS), a sub-sampling method based on loss rank-disagreement across independent proxy ensemble. We prove finite-sample concentration bounds showing that the empirical rank disagreement of bulk corrupted examples is bounded above, and that of boundary-clean examples bounded below, both at rate $O(\sqrt{\log(N/δ)/K})$ with probability $1-δ$; when the structural expectation gap $Δ'$ between the two groups is positive and the boundary-clean set is at least as large as the selected subset, these bounds certify strict separation and control the contamination rate of the selected subset. Empirically, DR-IS remains robust under targeted high-norm attacks that break magnitude-based methods such as the Error $L_2$-norm (EL2N) on benchmark datasets. DR-IS complements training-dynamics approaches like Area Under the Margin ranking (AUM), offering improved robustness in the loss-aligned regime alongside explicit finite-sample concentration certificates and a contamination bound limiting noise leakage from the statistical tail of corrupted points.
- Abstract(参考訳): 標準重要度サンプリング(IS)はラベルの破損により崩壊するが、これは高ノルムな例が分散の低減に優先され、しばしば逆向きの外れ値となるためである。
我々は、$\varepsilon$-contaminationモデルを用いて、このミスアライメントを形式化し、独立プロキシアンサンブル間の損失ランクの解消に基づくサブサンプリング手法であるDisagreement-Regularized Importance Smpling (DR-IS)を提案する。
我々は、バルク崩壊した例の実証的なランクの不一致が上述の有界であることを示し、下記の有界クリーンな例は、確率が 1-δ$ の速度で$O(\sqrt{\log(N/δ)/K})$ で表される。 2つの群の間の構造的期待ギャップ $Δ'$ が正であり、境界クリーン集合が選択された部分集合の少なくとも大きければ、これらの有界は厳密な分離と選択された部分集合の汚染率の制御を証明している。
実験的にDR-ISは、ベンチマークデータセット上のError $L_2$-norm (EL2N)のようなマグニチュードベースのメソッドを破るターゲットの高いノーム攻撃の下で、堅牢である。
DR-ISは、AUM(Area Under the Margin Rank)のようなトレーニング力学のアプローチを補完し、明確な有限サンプル濃度証明書と、破損した点の統計的尾部からのノイズリークを制限する汚染境界付きノイズリークと共に、損失整合性の改善されたロバスト性を提供する。
関連論文リスト
- Distributionally Robust K-Means Clustering [18.037323759791658]
K平均のクラスタリングは、異常値、分布シフト、サンプルサイズに制限があることで知られている。
我々はそのような病態から保護する分布的に堅牢な変種を開発する。
トラクタブル双対は、ハード割り当てを滑らかに重み付けされたものに置き換えるソフトクラスタリングスキームを得る。
論文 参考訳(メタデータ) (2026-04-13T07:32:36Z) - Non-monotonicity in Conformal Risk Control [4.71350885287928]
コンフォーマルリスク制御(CRC)は、ユーザ指定レベルでの期待損失を制御するための、配布不要の保証を提供する。
有限格子からチューニングパラメータを選択する際に, CRC を非単調な損失関数で検討する。
単調性のないCRCの妥当性は, キャリブレーション試料サイズとグリッド分解能の関係に依存することを示す。
論文 参考訳(メタデータ) (2026-04-02T00:26:50Z) - Fair regression under localized demographic parity constraints [9.082079838093371]
F f |S=s (z m ) = $ell$m という形の CDF 制約をグループ的に課する,新規な (ell$, Z)-fair predictor を導入する。
合成データセットと実データセットの実験では、解釈可能なフェアネス精度のトレードオフが示され、決定関連量子またはしきい値に対するターゲット修正が可能である。
論文 参考訳(メタデータ) (2026-03-26T09:21:05Z) - Partial Causal Structure Learning for Valid Selective Conformal Inference under Interventions [0.0]
ゲノミクスの実験では、交換可能性はしばしば、対象変数を「影響を受けない」ままにしておく介入のサブセットにのみ保持される。
i)「影響のない」キャリブレーション例の誤分類が、明示的な関数$g(,n)$の汚染分数とキャリブレーションセットサイズを介してどのようにカバレッジを劣化させるか、および (ii) 2つの後続指標$Z_a,i=mathbf1iinmathrmdesc(a)$のみを推定するタスク駆動部分因果学習の定式化。
論文 参考訳(メタデータ) (2026-03-02T18:58:22Z) - Bulk-Calibrated Credal Ambiguity Sets: Fast, Tractable Decision Making under Out-of-Sample Contamination [8.826173150779145]
分散ロバストな最適化(DRO)は、あいまいさセットよりも最悪のケースで予想される損失を最小化する。
我々は,IPクレダルセットが,解釈可能な許容レベルを持つDRO目標にどのように変換されるかを示す。
論文 参考訳(メタデータ) (2026-01-29T06:37:36Z) - Combating Noisy Labels through Fostering Self- and Neighbor-Consistency [120.4394402099635]
ラベルノイズは様々な現実世界のシナリオで広まり、教師付きディープラーニングの課題を提起する。
我々は、Jo-SNC(textbfSelf- と textbfNeighbor-textbfConsistency に基づくサンプル選択とモデル正規化)というノイズロバスト手法を提案する。
我々は、クラスごとの選択閾値を調整するための自己適応型データ駆動しきい値設定方式を設計する。
論文 参考訳(メタデータ) (2026-01-19T07:55:29Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Label Distributionally Robust Losses for Multi-class Classification:
Consistency, Robustness and Adaptivity [55.29408396918968]
多クラス分類のためのラベル分布ロバスト(LDR)損失という損失関数群について検討した。
我々の貢献は、多クラス分類のためのLDR損失のトップ$kの一貫性を確立することによって、一貫性と堅牢性の両方を含んでいる。
本稿では,各インスタンスのクラスラベルの雑音度に個別化温度パラメータを自動的に適応させる適応型LDR損失を提案する。
論文 参考訳(メタデータ) (2021-12-30T00:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。