論文の概要: Bias and Priors in Machine Learning Calibrations for High Energy Physics
- arxiv url: http://arxiv.org/abs/2205.05084v1
- Date: Tue, 10 May 2022 18:00:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-14 08:57:48.775393
- Title: Bias and Priors in Machine Learning Calibrations for High Energy Physics
- Title(参考訳): 高エネルギー物理のための機械学習校正のバイアスと先行
- Authors: Rikab Gambhir, Benjamin Nachman, and Jesse Thaler
- Abstract要約: 機械学習に基づくキャリブレーション戦略の事前依存性を強調した。
シミュレーションベースとデータベースキャリブレーションの両方に対する最近の提案は、トレーニングに使用されるサンプルの特性を継承している。
シミュレーションに基づくキャリブレーションの場合、我々の最近提案したガウスアンサッツアプローチは、先行依存の落とし穴を回避できると論じる。
- 参考スコア(独自算出の注目度): 1.5675763601034223
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning offers an exciting opportunity to improve the calibration of
nearly all reconstructed objects in high-energy physics detectors. However,
machine learning approaches often depend on the spectra of examples used during
training, an issue known as prior dependence. This is an undesirable property
of a calibration, which needs to be applicable in a variety of environments.
The purpose of this paper is to explicitly highlight the prior dependence of
some machine learning-based calibration strategies. We demonstrate how some
recent proposals for both simulation-based and data-based calibrations inherit
properties of the sample used for training, which can result in biases for
downstream analyses. In the case of simulation-based calibration, we argue that
our recently proposed Gaussian Ansatz approach can avoid some of the pitfalls
of prior dependence, whereas prior-independent data-based calibration remains
an open problem.
- Abstract(参考訳): 機械学習は、高エネルギー物理検出器でほぼすべての再構成された物体の校正を改善するエキサイティングな機会を提供する。
しかしながら、機械学習のアプローチは、トレーニング中に使用される例のスペクトルに依存することが多い。
これはキャリブレーションの望ましくない性質であり、様々な環境に適用する必要がある。
本研究の目的は,機械学習による校正戦略の事前依存性を明確にすることである。
シミュレーションベースとデータベースキャリブレーションの両方に対する最近の提案は、トレーニングに使用されるサンプルの特性を継承し、下流分析のバイアスをもたらす可能性があることを実証する。
シミュレーションベースキャリブレーションの場合、最近提案されているガウス型アンサッツ法では、事前依存の落とし穴を回避できるが、事前非依存のデータベースキャリブレーションは未解決の問題である。
関連論文リスト
- Beware of Calibration Data for Pruning Large Language Models [41.1689082093302]
トレーニング後のプルーニングは、リソース集約的な反復的なトレーニングを必要としない有望な方法である。
キャリブレーションデータの効果は, 先進的な刈り取り戦略を設計するよりもさらに価値が高いことを示す。
予備調査では、トレーニングデータに類似したキャリブレーションデータを使用することで、より良いパフォーマンスが得られることも明らかにした。
論文 参考訳(メタデータ) (2024-10-23T09:36:21Z) - Machine Learning for predicting chaotic systems [0.0]
我々は、よく調整された単純な手法と、未調整のベースライン手法が、しばしば最先端のディープラーニングモデルより優れていることを示す。
これらの結果は、データ特性と利用可能な計算資源に対するマッチング予測手法の重要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-07-29T16:34:47Z) - Reassessing How to Compare and Improve the Calibration of Machine Learning Models [7.183341902583164]
結果の予測確率がモデル予測に基づいてその結果の観測周波数と一致した場合、機械学習モデルを校正する。
キャリブレーションと予測の指標が追加の一般化の指標を伴わない限り、最先端のように見えるような簡単な再校正手法が存在することを示す。
論文 参考訳(メタデータ) (2024-06-06T13:33:45Z) - Calibration by Distribution Matching: Trainable Kernel Calibration
Metrics [56.629245030893685]
カーネルベースのキャリブレーションメトリクスを導入し、分類と回帰の両方で一般的なキャリブレーションの形式を統一・一般化する。
これらの指標は、異なるサンプル推定を許容しており、キャリブレーションの目的を経験的リスク最小化に組み込むのが容易である。
決定タスクにキャリブレーションメトリクスを調整し、正確な損失推定を行ない、後悔しない決定を行うための直感的なメカニズムを提供する。
論文 参考訳(メタデータ) (2023-10-31T06:19:40Z) - Calibration of Neural Networks [77.34726150561087]
本稿では,ニューラルネットワークの文脈における信頼性校正問題について調査する。
我々は,問題文,キャリブレーション定義,評価に対する異なるアプローチについて分析する。
実験実験では、様々なデータセットとモデルをカバーし、異なる基準に従って校正方法を比較する。
論文 参考訳(メタデータ) (2023-03-19T20:27:51Z) - Sharp Calibrated Gaussian Processes [58.94710279601622]
キャリブレーションされたモデルを設計するための最先端のアプローチは、ガウス過程の後方分散を膨らませることに依存している。
本稿では,バニラガウス過程の後方分散にインスパイアされた計算を用いて,予測量子化を生成するキャリブレーション手法を提案する。
我々のアプローチは合理的な仮定の下で校正されたモデルが得られることを示す。
論文 参考訳(メタデータ) (2023-02-23T12:17:36Z) - Variable-Based Calibration for Machine Learning Classifiers [11.9995808096481]
モデルのキャリブレーション特性を特徴付けるために,変数ベースのキャリブレーションの概念を導入する。
ほぼ完全なキャリブレーション誤差を持つモデルでは,データの特徴の関数としてかなりの誤校正が期待できることがわかった。
論文 参考訳(メタデータ) (2022-09-30T00:49:31Z) - Calibrate: Interactive Analysis of Probabilistic Model Output [5.444048397001003]
従来の手法の欠点に耐性のある,インタラクティブな信頼性図であるCalibrateを提示する。
実世界のデータと合成データの両方のユースケースを通じて、Calibrateの実用性を実証する。
論文 参考訳(メタデータ) (2022-07-27T20:01:27Z) - Investigation of Different Calibration Methods for Deep Speaker
Embedding based Verification Systems [66.61691401921296]
本稿では, ディープスピーカ埋込抽出器のスコアキャリブレーション法について検討する。
この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
論文 参考訳(メタデータ) (2022-03-28T21:22:22Z) - T-Cal: An optimal test for the calibration of predictive models [49.11538724574202]
有限検証データセットを用いた予測モデルの誤校正を仮説検証問題として検討する。
誤校正の検出は、クラスの条件付き確率が予測の十分滑らかな関数である場合にのみ可能である。
我々は、$ell$-Expected Error(ECE)のデバイアスドプラグイン推定器に基づくキャリブレーションのためのミニマックステストであるT-Calを提案する。
論文 参考訳(メタデータ) (2022-03-03T16:58:54Z) - Unsupervised Calibration under Covariate Shift [92.02278658443166]
ドメインシフト下でのキャリブレーションの問題を導入し、それに対処するための重要サンプリングに基づくアプローチを提案する。
実世界のデータセットと合成データセットの両方において,本手法の有効性を評価し検討した。
論文 参考訳(メタデータ) (2020-06-29T21:50:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。