論文の概要: On Local Population-Risk Certificates
- arxiv url: http://arxiv.org/abs/2606.19147v1
- Date: Wed, 17 Jun 2026 14:50:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.216786
- Title: On Local Population-Risk Certificates
- Title(参考訳): 地域人口・リスク証明書について
- Authors: Mingzhi Song,
- Abstract要約: ローカルな候補集合 (mathcal D) に対して、証明書は (P(ell_+v-ell_)) over (vinmathcal D) の両側信頼バンドである。
アプリケーションとして、このバンドの上端は、リスク制御された更新ルールを出力する: 更新は、その認証された上端が非陽性である場合にのみ受け入れられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper develops local certificates for population-risk increments around a current model. For a local candidate set \(\mathcal D\), the certificate is a two-sided confidence band for \(P({\ell_{θ+v}-\ell_θ})\) over \(v\in\mathcal D\). As an application, the upper endpoint of this band yields a risk-controlled update rule: an update is accepted only when its certified upper endpoint is nonpositive; otherwise the current model is retained.
- Abstract(参考訳): 本稿では,現在のモデルを中心とした人口リスク増加の地域証明書を開発する。
局所的候補集合 \(\mathcal D\) に対して、証明書は \(P({\ell_{θ+v}-\ell_θ})\) に対して \(v\in\mathcal D\) の両側信頼バンドである。
アプリケーションとして、このバンドの上端は、リスク制御された更新ルールをもたらす: 更新は、その認定された上端が非陽性である場合にのみ受け入れられる。
関連論文リスト
- Beyond Red-Teaming: Formal Guarantees of LLM Guardrail Classifiers [1.9839136494100942]
ガードレールは生産言語モデルを有害な行動から保護するが、正式な保証は提供しない。
SVD整列超矩形とガウス混合モデルという2つの領域の構成を提案する。
このフレームワークを、毒性ドメイン上の3つの著者がトレーニングしたガードレールに適用すると、すべての超矩形構成はSATを返す。
GPT-2とLlama-3.1-8Bは、様々な境界で90%と80%の堅牢なカバーを維持しているが、BERTの安全保証は独特な揮発性を証明している。
論文 参考訳(メタデータ) (2026-05-11T17:41:38Z) - Fine-Tuning Integrity for Modern Neural Networks: Structured Drift Proofs via Norm, Rank, and Sparsity Certificates [3.333639687907171]
ファインチューニングは現在、大規模なニューラルネットワークを適用するための主要な方法であるが、新たな整合性リスクも導入されている。
信頼できない当事者は、バックドアを挿入したり、安全行動を変更したり、小さな更新のみを主張しながらモデルの大きな部分を上書きしたりできる。
制御モデル進化のセキュリティ目標としてFTI(Fin-Tuning Integrity)を導入する。
論文 参考訳(メタデータ) (2026-04-06T15:04:27Z) - Conformal Inductive Graph Neural Networks [58.450154976190795]
コンフォーマル予測(CP)は、任意のモデルの出力を真のラベルを含むことが保証された予測セットに変換する。
CPは、有効な分布のないカバレッジを保証するために、i.d.仮定の緩和である交換可能性を必要とする。
従来のCPは、新しいノードとのメッセージパッシングによって生じる(校正)スコアの暗黙的なシフトのため、誘導的な設定では適用できない。
保証が予測時間(例えば、新しいノード/エッジの到着時や後続の瞬間)とは独立に成り立つことを証明します。
論文 参考訳(メタデータ) (2024-07-12T11:12:49Z) - Adaptive Hierarchical Certification for Segmentation using Randomized Smoothing [87.48628403354351]
機械学習の認証は、特定の条件下では、敵対的なサンプルが特定の範囲内でモデルを回避できないことを証明している。
セグメンテーションの一般的な認証方法は、平らな粒度のクラスを使い、モデルの不確実性による高い断続率をもたらす。
本稿では,複数レベルの階層内で画素を認証し,不安定なコンポーネントに対して粗いレベルに適応的に認証を緩和する,新しい,より実用的な設定を提案する。
論文 参考訳(メタデータ) (2024-02-13T11:59:43Z) - Et Tu Certifications: Robustness Certificates Yield Better Adversarial Examples [30.42301446202426]
我々の新しいEmphCertification Aware Attackは、計算効率のよい規範最小化対逆例を生成するために認証を利用する。
これらの攻撃は、認証境界の厳密性を評価するために使用できるが、認定のリリースは、パラドックス的にセキュリティを低下させる可能性があることも強調している。
論文 参考訳(メタデータ) (2023-02-09T00:10:05Z) - Localized Randomized Smoothing for Collective Robustness Certification [60.83383487495282]
我々は、あらゆる種類のモデルに対してより一般的な集合的ロバスト性証明を提案する。
このアプローチは、より大規模なソフトな局所モデルに対して有益であることを示す。
この証明書は、我々の新しい局所的ランダム化平滑化アプローチに基づいている。
論文 参考訳(メタデータ) (2022-10-28T14:10:24Z) - Double Bubble, Toil and Trouble: Enhancing Certified Robustness through
Transitivity [27.04033198073254]
ニューラルネットワークモデルの分類を反転させる微妙な敵の例に反応して、最近の研究は、ソリューションとして証明された堅牢性を促進している。
我々は,今日の"最適"証明書が,認証の推移性と入力空間の幾何学の両方を活用することで,どのように改善できるかを示す。
また, 得られた認定半径の4ドルパーセンテージを均一に増加させることにより, さらに有望な結果が得られた。
論文 参考訳(メタデータ) (2022-10-12T10:42:21Z) - Smooth-Reduce: Leveraging Patches for Improved Certified Robustness [100.28947222215463]
本研究では,Smooth-Reduce の学習自由な修正スムース化手法を提案する。
提案アルゴリズムは,入力画像から抽出した重なり合うパッチを分類し,予測ロジットを集約して,入力周辺の半径が大きいことを証明する。
我々は,このような証明書の理論的保証を提供し,他のランダムな平滑化手法に対する顕著な改善を実証的に示す。
論文 参考訳(メタデータ) (2022-05-12T15:26:20Z) - ANCER: Anisotropic Certification via Sample-wise Volume Maximization [134.7866967491167]
本稿では,与えられたテストセットのサンプルに対して,ボリュームを介して異方性証明書を取得するためのフレームワークであるanceRを紹介する。
その結果,CERはCIFAR-10とImageNetの両方で複数の半径で精度を導入し,ボリュームの面ではかなり大きな領域を認証していることがわかった。
論文 参考訳(メタデータ) (2021-07-09T17:42:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。