論文の概要: Benchmarking Uncertainty Disentanglement: Specialized Uncertainties for
Specialized Tasks
- arxiv url: http://arxiv.org/abs/2402.19460v1
- Date: Thu, 29 Feb 2024 18:52:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 13:30:24.048929
- Title: Benchmarking Uncertainty Disentanglement: Specialized Uncertainties for
Specialized Tasks
- Title(参考訳): 不確かさのベンチマーク:特定課題の特定不確実性
- Authors: B\'alint Mucs\'anyi and Michael Kirchhof and Seong Joon Oh
- Abstract要約: 本稿では,ImageNet上の様々なタスクにおける多数の不確実性推定器の包括的評価を行う。
我々は,有望な理論的努力にもかかわらず,実際に解離が達成されていないことを発見した。
特定のタスクをどの不確実性推定器で実行し、実践者に洞察を与えるかを明らかにする。
- 参考スコア(独自算出の注目度): 19.945932368701722
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncertainty quantification, once a singular task, has evolved into a spectrum
of tasks, including abstained prediction, out-of-distribution detection, and
aleatoric uncertainty quantification. The latest goal is disentanglement: the
construction of multiple estimators that are each tailored to one and only one
task. Hence, there is a plethora of recent advances with different intentions -
that often entirely deviate from practical behavior. This paper conducts a
comprehensive evaluation of numerous uncertainty estimators across diverse
tasks on ImageNet. We find that, despite promising theoretical endeavors,
disentanglement is not yet achieved in practice. Additionally, we reveal which
uncertainty estimators excel at which specific tasks, providing insights for
practitioners and guiding future research toward task-centric and disentangled
uncertainty estimation methods. Our code is available at
https://github.com/bmucsanyi/bud.
- Abstract(参考訳): 不確かさの定量化は、かつては特異なタスクであったが、断続的な予測、分布外検出、アリュータ的不確かさの定量化など、様々なタスクへと進化してきた。
最新の目標は、複数の推定器の構築であり、それぞれが1つのタスクと1つのタスクに調整されている。
したがって、様々な意図を持つ最近の進歩は、しばしば実践的な行動から完全に逸脱することが多い。
本稿では,ImageNet上の様々なタスクにおける多数の不確実性推定器の包括的評価を行う。
有望な理論的な努力にもかかわらず、実際にはまだ解離は達成されていない。
さらに,特定のタスクを抽出する不確実性推定器がどのタスクを抽出するかを明らかにし,実践者への洞察を与え,タスク中心および不整合性推定手法の今後の研究を導く。
私たちのコードはhttps://github.com/bmucsanyi/bud.comで利用可能です。
関連論文リスト
- CLUE: Concept-Level Uncertainty Estimation for Large Language Models [49.92690111618016]
大規模言語モデル(LLM)のための概念レベル不確実性推定のための新しいフレームワークを提案する。
LLMを利用して、出力シーケンスを概念レベルの表現に変換し、シーケンスを個別の概念に分解し、各概念の不確かさを個別に測定する。
我々は,文レベルの不確実性と比較して,CLUEがより解釈可能な不確実性推定結果を提供できることを示す実験を行った。
論文 参考訳(メタデータ) (2024-09-04T18:27:12Z) - Calibrated Uncertainty Quantification for Operator Learning via
Conformal Prediction [95.75771195913046]
本稿では, リスク制御型量子ニューラル演算子, 分布のない有限サンプル機能キャリブレーション等式予測法を提案する。
関数領域上の点の期待値として定義されるカバレッジ率に関する理論的キャリブレーションを保証する。
2次元ダーシー流と3次元自動車表面圧力予測タスクに関する実験結果から,我々の理論的結果が検証された。
論文 参考訳(メタデータ) (2024-02-02T23:43:28Z) - Multidimensional Belief Quantification for Label-Efficient Meta-Learning [7.257751371276488]
ラベル付きメタ学習のための新しい不確実性を考慮したタスク選択モデルを提案する。
提案したモデルは、既知の不確実性を定量化し、与えられたタスクの未知の不確実性を低くする多次元的信念尺度を定式化する。
複数の実世界の複数ショット画像分類タスクに対して行われた実験は、提案モデルの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-23T23:37:16Z) - See Yourself in Others: Attending Multiple Tasks for Own Failure
Detection [28.787334666116518]
複数のタスク間の相関を利用して注意に基づく障害検出手法を提案する。
提案フレームワークは、画像内の複数の領域に対する複数の視覚的知覚タスクに対して、個々の予測を評価することでタスクの失敗を推測する。
提案手法は,タスクの予測に対する予測誤差をより正確に推定する。
論文 参考訳(メタデータ) (2021-10-06T07:42:57Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Learning Uncertainty For Safety-Oriented Semantic Segmentation In
Autonomous Driving [77.39239190539871]
自律運転における安全クリティカル画像セグメンテーションを実現するために、不確実性推定をどのように活用できるかを示す。
相似性関数によって測定された不一致予測に基づく新しい不確実性尺度を導入する。
本研究では,提案手法が競合手法よりも推論時間において計算集約性が低いことを示す。
論文 参考訳(メタデータ) (2021-05-28T09:23:05Z) - Exploring Uncertainty in Deep Learning for Construction of Prediction
Intervals [27.569681578957645]
深層学習における不確実性を探究し,予測区間を構築する。
不確実性ラベルなしで不確実性を学習できる特殊損失関数を設計した。
本手法は予測間隔の構成と不確実性推定とを関連付ける。
論文 参考訳(メタデータ) (2021-04-27T02:58:20Z) - Temporal Difference Uncertainties as a Signal for Exploration [76.6341354269013]
強化学習における探索の効果的なアプローチは、最適な政策に対するエージェントの不確実性に依存することである。
本稿では,評価値のバイアスや時間的に矛盾する点を強調した。
本稿では,時間差誤差の分布の導出に依存する値関数の不確かさを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-10-05T18:11:22Z) - Robust Learning Through Cross-Task Consistency [92.42534246652062]
クロスタスク整合性を用いた学習向上のための,広く適用可能な完全計算手法を提案する。
クロスタスク一貫性による学習は,より正確な予測と,アウト・オブ・ディストリビューション・インプットの一般化につながることを観察する。
論文 参考訳(メタデータ) (2020-06-07T09:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。