論文の概要: Certification of Machine Learning Models via Directional Sharpness
- arxiv url: http://arxiv.org/abs/2606.25004v1
- Date: Tue, 23 Jun 2026 17:07:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.090435
- Title: Certification of Machine Learning Models via Directional Sharpness
- Title(参考訳): 方向シャープネスによる機械学習モデルの認証
- Authors: Gefei Tan, Adria Gascon, Sarah Meiklejohn, Mariana Raykova,
- Abstract要約: モデルの品質は、トレーニングされたデータ以上のデータに対して、その一般化能力によって決定される。
未知のデータに依存し、直接測定できないため、直接一般化を認証することは不可能である。
トレーニングの偏差があるにもかかわらず、効率よく、かつ確実に一般化を示すための指標である方向性の鋭さを提案する。
- 参考スコア(独自算出の注目度): 5.687933304893888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In machine learning, model certification has been identified as an important method for gaining assurance about a model's trustworthiness and quality. A model's quality is largely determined by its ability to generalize, i.e., to perform well on data beyond what it was trained on. It is not possible to certify generalization directly, however, as it depends on unknown data and is not directly measurable. Proxies such as test accuracy can be misleading when the training process is perturbed (intentionally or accidentally), and metrics such as sharpness -- which has an empirically supported link to generalization -- are computationally expensive and can also serve as unreliable signals when training deviates from a prescribed procedure. In this work, we propose directional sharpness, a metric designed to efficiently and reliably indicate generalization despite potential training deviations. We provide empirical and analytical evidence that directional sharpness (1) correlates more strongly with generalization than existing metrics and (2) identifies models with poor generalization more reliably than existing metrics. Furthermore, directional sharpness is efficiently computable in model auditing settings, where the verifier has access to training data, and via zero-knowledge proofs that certify quality without revealing training data.
- Abstract(参考訳): 機械学習では、モデルの信頼性と品質を保証するための重要な方法として、モデルの認証が特定されている。
モデルの品質は、主に、トレーニングされたデータを超えて、データに対して優れたパフォーマンスを発揮できる能力によって決定される。
しかし、未知のデータに依存し、直接測定できないため、直接一般化を認証することは不可能である。
テスト精度などのプロキシは、トレーニングプロセスが(意図的または誤って)摂動されたときに誤解を招くことがあるが、例えば、鋭さ(一般化に実証的に支持されたリンクを持つ)のようなメトリクスは、計算コストが高く、トレーニングが所定の手順から逸脱したときには、信頼できない信号として機能する。
本研究では,トレーニングの偏差があるにもかかわらず,効率よくかつ確実に一般化を示すための指標である指向性シャープネスを提案する。
我々は,(1)方向のシャープネスが,既存の指標よりも一般化と強く相関し,(2)既存の指標よりも信頼性の低いモデルを特定するという実証的および分析的な証拠を提供する。
さらに、検証者がトレーニングデータにアクセス可能なモデル監査設定や、トレーニングデータを明らかにすることなく品質を証明できるゼロ知識証明において、方向性の鋭さを効率的に計算することができる。
関連論文リスト
- Auditing Machine Unlearning: A Systematic Research on Whether Models Truly Forget [25.03537230361785]
本稿では,機械学習のための実践的,汎用的な監査フレームワークを提案する。
本フレームワークは,スクラッチベースラインの再トレーニングの必要性を排除し,既存のメソッドの限界に対処する。
我々のフレームワークは、偽の未学習の試みに対して堅牢であることを示し、大きな言語モデルによく当てはまることを示す。
論文 参考訳(メタデータ) (2026-06-15T01:56:09Z) - When Models Know When They Do Not Know: Calibration, Cascading, and Cleaning [10.585100830578934]
有望なアプローチは、モデルの内部信号から計算された信頼を利用して、その無知を反映することである。
本稿では,視覚モデルと言語モデルの両方に適用可能な,シンプルで効果的で普遍的な訓練自由な手法を提案する。
我々の結果は、モデルが知らないときに認識できるようにすることが、より効率的で信頼性があり、信頼できるAIへの実践的なステップであることを示している。
論文 参考訳(メタデータ) (2026-01-12T19:59:03Z) - What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - Selective Learning: Towards Robust Calibration with Dynamic Regularization [79.92633587914659]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。
トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文 参考訳(メタデータ) (2024-02-13T11:25:20Z) - Weak Supervision Performance Evaluation via Partial Identification [46.73061437177238]
Programmatic Weak Supervision (PWS) は、地上の真理ラベルに直接アクセスすることなく、教師付きモデルトレーニングを可能にする。
本稿では,モデル評価を部分的同定問題としてフレーミングすることで,この問題に対処する新しい手法を提案する。
提案手法は,従来の弱監督評価手法において,ラベル付きデータを必要とせず,重要な指標に信頼性のあるバウンダリを導出する。
論文 参考訳(メタデータ) (2023-12-07T07:15:11Z) - Adaptive Certified Training: Towards Better Accuracy-Robustness
Tradeoffs [17.46692880231195]
本稿では,適応型認定ラジイを用いたトレーニングがモデルの精度と堅牢性の向上に役立つというキーインサイトに基づく,新しい認定トレーニング手法を提案する。
提案手法の有効性を,MNIST,CIFAR-10,TinyImageNetデータセットに示す。
論文 参考訳(メタデータ) (2023-07-24T18:59:46Z) - Post-hoc Uncertainty Learning using a Dirichlet Meta-Model [28.522673618527417]
本研究では,不確実性定量化能力の優れた事前学習モデルを構築するための新しいベイズメタモデルを提案する。
提案手法は追加のトレーニングデータを必要としないため,不確かさの定量化に十分な柔軟性がある。
提案するメタモデルアプローチの柔軟性と,これらのアプリケーションに対する優れた経験的性能を実証する。
論文 参考訳(メタデータ) (2022-12-14T17:34:11Z) - Don't Just Blame Over-parametrization for Over-confidence: Theoretical
Analysis of Calibration in Binary Classification [58.03725169462616]
理論上は、過剰パラメトリゼーションは過剰信頼の唯一の理由ではない。
我々は、ロジスティック回帰は本質的に信頼過剰であり、実現可能で、非パラメータな設定であることを示す。
おそらく驚くことに、過剰な信頼が常にそうであるとは限らないことも示します。
論文 参考訳(メタデータ) (2021-02-15T21:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。