論文の概要: Conformal prediction under ambiguous ground truth
- arxiv url: http://arxiv.org/abs/2307.09302v1
- Date: Tue, 18 Jul 2023 14:40:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 14:25:43.239113
- Title: Conformal prediction under ambiguous ground truth
- Title(参考訳): 曖昧な基底真理の下での共形予測
- Authors: David Stutz, Abhijit Guha Roy, Tatiana Matejovicova, Patricia
Strachan, Ali Taylan Cemgil, Arnaud Doucet
- Abstract要約: 安全クリティカルな分類タスクでは、共形予測は厳密な不確実性定量化を行うことができる。
多くのドメインでは、そのようなラベルは入手が困難であり、専門家の意見の集約によって通常近似される。
このようなラベルを用いた共形予測の適用は不確実性を過小評価する。
- 参考スコア(独自算出の注目度): 26.73933527115414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In safety-critical classification tasks, conformal prediction allows to
perform rigorous uncertainty quantification by providing confidence sets
including the true class with a user-specified probability. This generally
assumes the availability of a held-out calibration set with access to ground
truth labels. Unfortunately, in many domains, such labels are difficult to
obtain and usually approximated by aggregating expert opinions. In fact, this
holds true for almost all datasets, including well-known ones such as CIFAR and
ImageNet. Applying conformal prediction using such labels underestimates
uncertainty. Indeed, when expert opinions are not resolvable, there is inherent
ambiguity present in the labels. That is, we do not have ``crisp'', definitive
ground truth labels and this uncertainty should be taken into account during
calibration. In this paper, we develop a conformal prediction framework for
such ambiguous ground truth settings which relies on an approximation of the
underlying posterior distribution of labels given inputs. We demonstrate our
methodology on synthetic and real datasets, including a case study of skin
condition classification in dermatology.
- Abstract(参考訳): 安全クリティカルな分類タスクにおいて、コンフォメーション予測は、真のクラスを含む信頼セットをユーザ特定確率で提供することにより、厳密な不確実性定量化を行うことができる。
これは一般に、基底の真理ラベルにアクセス可能なキャリブレーションセットが利用可能であると仮定する。
残念なことに、多くのドメインではそのようなラベルは入手が困難であり、専門家の意見をまとめることによって通常近似される。
実際、これはCIFARやImageNetなど、ほとんどすべてのデータセットで当てはまります。
そのようなラベルを用いた共形予測の適用は不確実性を過小評価する。
実際、専門家の意見が解決できない場合、ラベルに固有の曖昧さが存在する。
すなわち、'crisp'、決定的な根本的真理ラベルを持たず、校正中にこの不確実性を考慮するべきである。
本稿では,入力されたラベルの下位分布の近似に依存する,曖昧な基底的真理設定のための共形予測フレームワークを開発した。
皮膚科における皮膚状態分類のケーススタディを含む,合成および実データ集合に関する方法論を実証する。
関連論文リスト
- A class of ternary codes with few weights [0.0]
本稿では,$mathcalC$ := (textTr) := (textTr(dx), dots, dots, d_n$で定義される3次コード$mathcalC$ of length $n$について検討する。
指数和の明示的な評価に関する最近の結果を用いて、Weil境界とテクニックを判定し、$mathcalC$の双対符号がハミング境界に対して最適であることを示す。
論文 参考訳(メタデータ) (2024-10-05T16:15:50Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - A random matrix model for random approximate $t$-designs [1.534667887016089]
任意の$t$に対して$delta(nu_mathcalS,t)$の確率分布を記述するためにランダム行列モデルを提案する。
我々のモデルはいわゆるスペクトルギャップ予想を満足していること、すなわち、$sup が $tinmathbbZ_+$ であること、すなわち $sup が $tinmathbbZ_+delta(k)=delta(t)$ であることを示す。
論文 参考訳(メタデータ) (2022-10-14T14:50:06Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Random matrices in service of ML footprint: ternary random features with
no performance loss [55.30329197651178]
我々は、$bf K$ の固有スペクトルが$bf w$ の i.d. 成分の分布とは独立であることを示す。
3次ランダム特徴(TRF)と呼ばれる新しいランダム手法を提案する。
提案したランダムな特徴の計算には乗算が不要であり、古典的なランダムな特徴に比べてストレージに$b$のコストがかかる。
論文 参考訳(メタデータ) (2021-10-05T09:33:49Z) - Spectral properties of sample covariance matrices arising from random
matrices with independent non identically distributed columns [50.053491972003656]
関数 $texttr(AR(z))$, for $R(z) = (frac1nXXT- zI_p)-1$ and $Ain mathcal M_p$ deterministic, have a standard deviation of order $O(|A|_* / sqrt n)$.
ここでは、$|mathbb E[R(z)] - tilde R(z)|_F を示す。
論文 参考訳(メタデータ) (2021-09-06T14:21:43Z) - Kernel Thinning [26.25415159542831]
カーネルの薄型化は、サンプリングや標準的な薄型化よりも効率的に$mathbbP$を圧縮するための新しい手順である。
我々は、ガウス、マタン、およびB-スプライン核に対する明示的な非漸近的な最大誤差境界を導出する。
論文 参考訳(メタデータ) (2021-05-12T17:56:42Z) - Near-Optimal Model Discrimination with Non-Disclosure [19.88145627448243]
まず、二乗損失を持つよく特定された線形モデルについて考察する。
類似した形態のサンプルの複雑さは、たとえ不特定であっても引き起こされる。
論文 参考訳(メタデータ) (2020-12-04T23:52:54Z) - An example of prediction which complies with Demographic Parity and
equalizes group-wise risks in the context of regression [3.9596068699962323]
異なる処理を生成しないベイズ最適予測$f*$は、$f*(x) = mathbbE[Y | X = x]$と定義される。
本稿では,アルゴリズム的公正性の数学的概念をよりよく理解するために,この結果がもたらすいくつかの意味について論じる。
論文 参考訳(メタデータ) (2020-11-13T22:46:05Z) - Near-Optimal SQ Lower Bounds for Agnostically Learning Halfspaces and
ReLUs under Gaussian Marginals [49.60752558064027]
ガウス境界の下では、半空間とReLUを不可知的に学習する基本的な問題について検討する。
我々の下限は、これらのタスクの現在の上限が本質的に最良のものであるという強い証拠を与える。
論文 参考訳(メタデータ) (2020-06-29T17:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。