Fugu-MT 論文翻訳(概要): RRISE: Robust Radius Inference via a Surrogate Estimator

論文の概要: RRISE: Robust Radius Inference via a Surrogate Estimator

arxiv url: http://arxiv.org/abs/2606.02876v1
Date: Mon, 01 Jun 2026 20:46:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-03 22:00:04.599744
Title: RRISE: Robust Radius Inference via a Surrogate Estimator
Title（参考訳）: RRISE: 代理推定器によるロバスト半径推定
Authors: Jong-Ik Park, Shreyas Chaudhari, Carlee Joe-Wong, José M. F. Moura,
Abstract要約: 我々はRSフレームワークRRISEを導入し、認証を学習したサロゲートを1つのフォワードパスに圧縮する。 CIFAR-100とTiny ImageNetでは、唯一のオフラインサロゲート方式が崩壊し、RRISEは1.23ドルから1.91タイムスを高い精度で達成した。
参考スコア（独自算出の注目度）: 30.521314184750867
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Randomized smoothing (RS) uses a smoothed classifier to provide architecture-agnostic certificates of $\ell_2$ classification robustness, but its dependence on per-input Monte Carlo (MC) sampling undermines its use in real-time systems. We argue that this cost is structural rather than fundamental, such that it can be significantly reduced by sharing information across the deployment stream. We introduce RRISE, an RS framework that compresses certification into a single forward pass through a learned surrogate. RRISE trains the surrogate against precomputed MC class-count targets via a soft-label cross-entropy loss and converts surrogate predictions into provably conservative certified radii through a one-time conformal calibration step. The resulting certificate is deployment-verifiable: whenever the calibrated radius is positive, the surrogate's prediction provably matches the smoothed classifier's and the smoothed classifier is constant on a ball of that radius around the input. Across image classification benchmarks, RRISE matches fixed-budget MC certified accuracy within $0.84$ percentage points while replacing up to $10^4$ noisy base-model evaluations per query with a single surrogate forward pass, recouping MC training cost after $\approx 10^5$ deployment queries. On CIFAR-100 and Tiny ImageNet, where the only prior offline-surrogate method collapses, RRISE achieves $1.23$ to $1.91\times$ higher certified accuracy, establishing efficient randomized smoothing as a practical path to certified robustness in repeated-deployment settings.
Abstract（参考訳）: Randomized smoothing (RS) は、アーキテクチャに依存しない$$\ell_2$の分類ロバスト性を提供するためにスムースな分類器を使用するが、インプット毎のモンテカルロサンプリング(MC)への依存は、リアルタイムシステムにおけるその使用を損なう。このコストは基本的ではなく構造的であり、デプロイストリーム間で情報を共有することで大幅に削減できる、と私たちは主張する。我々はRSフレームワークRRISEを導入し、認証を学習したサロゲートを1つのフォワードパスに圧縮する。 RRISEは、ソフトラベルのクロスエントロピー損失を通じて、事前計算されたMCクラスカウントターゲットに対するサロゲートを訓練し、サロゲート予測を1回のコンフォメーションキャリブレーションステップによって、確実に保守的なラジイに変換する。キャリブレーションされた半径が正のとき、サロゲートの予測はスムーズな分類器と確実に一致し、スムーズな分類器は入力の周りの半径のボール上で一定である。画像分類ベンチマーク全体で、RRISEは固定予算のMC認証精度を0.84ドルのパーセンテージポイントで比較し、クエリ毎に最大10^4$のノイズの多いベースモデル評価を単一のサロゲートフォワードパスに置き換え、デプロイクエリが$\approx 10^5ドルの後にMCトレーニングコストを再結合する。 CIFAR-100とTiny ImageNetでは、唯一のオフラインサロゲート方式が崩壊し、RRISEは認証精度が1.23ドルから1.91ドルになった。

関連論文リスト

Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration [9.542597285477683]
テスト時間計算のスケーリングは言語モデルに非常に効果的であることが証明されているが、この機会は産業用クリックスルーレート(CTR)予測では探索されていない。 UTTSI(Uncertainty-Triggered Test-Time Selective Inference)は、トレーニング不要なモデルに依存しないフレームワークで、推論深度をインスタンスごとの不確実性に比例して拡張する。
論文参考訳（メタデータ） (2026-05-24T10:29:10Z)
Correction and Corruption: A Two-Rate View of Error Flow in LLM Protocols [51.56484100374058]
そこで本研究では,単一プロトコルステップを正確なマッチングタスクで監査するためのペアアウトカム計測インタフェースを提案する。各インスタンスについて、インターフェースはベースラインの正当性ビットと後ステップの正当性ビットを記録する。これらのレートは精度の変化を予測し、種、混合物、パイプライン間でテスト可能な再利用可能な経験的インターフェースを定義する。
論文参考訳（メタデータ） (2026-04-20T13:25:40Z)
$V_1$: Unifying Generation and Self-Verification for Parallel Reasoners [69.66089681814013]
$V_$は、効率的なペアワイドランキングを通じて生成と検証を統合するフレームワークである。 V_$-Inferはポイントワイド検証でPass@1を最大10%改善する。 V_$-PairRLは、標準のRLとポイントワイドのジョイントトレーニングよりも、テストタイムのスケーリングが7ドル--9%で向上する。
論文参考訳（メタデータ） (2026-03-04T17:22:16Z)
Technical report on label-informed logit redistribution for better domain generalization in low-shot classification with foundation models [3.938980910007962]
信頼度校正は、基礎モデルに基づく現実世界の意思決定システムにおいて、新たな課題である。本研究では,微調整の際,不正分類を罰する損失目標に組み込んだペナルティを提案する。 CMP(textitconfidence misalignment penalty)と呼ぶ。
論文参考訳（メタデータ） (2025-01-29T11:54:37Z)
SPLITZ: Certifiable Robustness via Split Lipschitz Randomized Smoothing [8.471466670802817]
SPLITZは、敵の例に証明可能な堅牢性を提供するための実用的で斬新なアプローチである。 SPLITZのモチベーションは、多くの標準ディープネットワークがリプシッツ定数の不均一性を示すという観察から来ている。 SPLITZは、MNIST、CIFAR-10、ImageNetデータセットにおける既存の最先端のアプローチを一貫して改善することを示す。
論文参考訳（メタデータ） (2024-07-03T05:13:28Z)
The Lipschitz-Variance-Margin Tradeoff for Enhanced Randomized Smoothing [85.85160896547698]
ディープニューラルネットワークの現実的な応用は、ノイズの多い入力や敵攻撃に直面した場合、その不安定な予測によって妨げられる。入力にノイズ注入を頼りに、認証された半径を持つ効率的な分類器を設計する方法を示す。新たな認証手法により、ランダムな平滑化による事前学習モデルの使用が可能となり、ゼロショット方式で現在の認証半径を効果的に改善できる。
論文参考訳（メタデータ） (2023-09-28T22:41:47Z)
Input-Specific Robustness Certification for Randomized Smoothing [76.76115360719837]
本稿では,ロバストネス認証の費用対効果を達成するために,インプット・スペクティブ・サンプリング(ISS)の高速化を提案する。 ISSは、認定半径0.05の限られたコストで3回以上、認定をスピードアップすることができる。
論文参考訳（メタデータ） (2021-12-21T12:16:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。