論文の概要: Benchmarking Bayesian Deep Learning on Diabetic Retinopathy Detection
Tasks
- arxiv url: http://arxiv.org/abs/2211.12717v1
- Date: Wed, 23 Nov 2022 05:44:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 13:27:16.734945
- Title: Benchmarking Bayesian Deep Learning on Diabetic Retinopathy Detection
Tasks
- Title(参考訳): 糖尿病網膜症検出タスクにおけるベイズ深層学習のベンチマーク
- Authors: Neil Band, Tim G. J. Rudner, Qixuan Feng, Angelos Filos, Zachary Nado,
Michael W. Dusenberry, Ghassen Jerfel, Dustin Tran, Yarin Gal
- Abstract要約: このような複雑さを正確に反映した実世界のタスクのセットを提案し、安全クリティカルシナリオにおける予測モデルの信頼性を評価する。
具体的には、糖尿病網膜症を呈する高解像度ヒト網膜画像の2つの公開データセットをキュレートする。
我々はこれらのタスクを用いて、タスク固有の評価指標に基づいて、確立された、そして最先端のベイズ深層学習手法をベンチマークする。
- 参考スコア(独自算出の注目度): 39.82245729848194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian deep learning seeks to equip deep neural networks with the ability
to precisely quantify their predictive uncertainty, and has promised to make
deep learning more reliable for safety-critical real-world applications. Yet,
existing Bayesian deep learning methods fall short of this promise; new methods
continue to be evaluated on unrealistic test beds that do not reflect the
complexities of downstream real-world tasks that would benefit most from
reliable uncertainty quantification. We propose the RETINA Benchmark, a set of
real-world tasks that accurately reflect such complexities and are designed to
assess the reliability of predictive models in safety-critical scenarios.
Specifically, we curate two publicly available datasets of high-resolution
human retina images exhibiting varying degrees of diabetic retinopathy, a
medical condition that can lead to blindness, and use them to design a suite of
automated diagnosis tasks that require reliable predictive uncertainty
quantification. We use these tasks to benchmark well-established and
state-of-the-art Bayesian deep learning methods on task-specific evaluation
metrics. We provide an easy-to-use codebase for fast and easy benchmarking
following reproducibility and software design principles. We provide
implementations of all methods included in the benchmark as well as results
computed over 100 TPU days, 20 GPU days, 400 hyperparameter configurations, and
evaluation on at least 6 random seeds each.
- Abstract(参考訳): Bayesianのディープラーニングは、彼らの予測の不確実性を正確に定量化する能力を備えたディープニューラルネットワークの装備を目指している。
新しい方法は、信頼性の高い不確実性定量化の恩恵を受ける下流の現実世界のタスクの複雑さを反映しない非現実的なテストベッドで評価され続けている。
本稿では,そのような複雑さを正確に反映した実世界のタスクのセットであるRETINA Benchmarkを提案し,安全クリティカルなシナリオにおける予測モデルの信頼性を評価する。
具体的には,様々な糖尿病網膜症を呈する高分解能ヒト網膜画像の2つの公開データセットを収集し,それを用いて信頼性の高い予測的不確実性定量化を必要とする一連の自動診断タスクを設計する。
我々はこれらのタスクを用いて、タスク固有の評価指標に基づいて、確立された最先端のベイズ深層学習手法をベンチマークする。
再現性とソフトウェア設計の原則に従って,高速で簡単なベンチマークを行うための,使いやすいコードベースを提供しています。
ベンチマークに含まれるすべてのメソッドの実装と、100 TPU日、20 GPU日、400のハイパーパラメータ構成を計算し、それぞれ6つのランダムシードの評価を行う。
関連論文リスト
- SURE: SUrvey REcipes for building reliable and robust deep networks [12.268921703825258]
本稿では,深層ニューラルネットワークにおける不確実性推定手法を再検討し,信頼性を高めるために一連の手法を統合する。
我々は,不確実性推定の有効性を示す重要なテストベッドである故障予測のベンチマークに対して,SUREを厳格に評価する。
データ破損、ラベルノイズ、長い尾のクラス分布といった現実世界の課題に適用した場合、SUREは顕著な堅牢性を示し、現在の最先端の特殊手法と同等あるいは同等な結果をもたらす。
論文 参考訳(メタデータ) (2024-03-01T13:58:19Z) - The Boundaries of Verifiable Accuracy, Robustness, and Generalisation in Deep Learning [71.14237199051276]
経験的リスクを最小限に抑えるため,古典的な分布に依存しないフレームワークとアルゴリズムを検討する。
理想的な安定かつ正確なニューラルネットワークの計算と検証が極めて難しいタスク群が存在することを示す。
論文 参考訳(メタデータ) (2023-09-13T16:33:27Z) - U-PASS: an Uncertainty-guided deep learning Pipeline for Automated Sleep
Staging [61.6346401960268]
プロセスの各段階で不確実性推定を組み込んだ臨床応用に適した,U-PASSと呼ばれる機械学習パイプラインを提案する。
不確実性誘導型ディープラーニングパイプラインを睡眠ステージングの困難な問題に適用し、各ステージにおけるパフォーマンスを体系的に改善することを示す。
論文 参考訳(メタデータ) (2023-06-07T08:27:36Z) - DUDES: Deep Uncertainty Distillation using Ensembles for Semantic
Segmentation [11.099838952805325]
予測の不確実性の定量化は、そのようなアプリケーションにディープニューラルネットワークを使用するための、有望な取り組みである。
本稿では,アンサンブルを用いた深部不確実性蒸留(DuDES)と呼ばれる,効率的かつ確実な不確実性評価手法を提案する。
DUDESはディープ・アンサンブル(Deep Ensemble)による学生-教師の蒸留を適用し、予測の不確かさを1つの前方パスで正確に推定する。
論文 参考訳(メタデータ) (2023-03-17T08:56:27Z) - BayesCap: Bayesian Identity Cap for Calibrated Uncertainty in Frozen
Neural Networks [50.15201777970128]
本研究では,凍結モデルに対するベイズIDマッピングを学習し,不確実性の推定を可能にするBayesCapを提案する。
BayesCapは、元のデータセットのごく一部でトレーニングできる、メモリ効率のよいメソッドである。
本稿では,多種多様なアーキテクチャを用いた多種多様なタスクに対する本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-07-14T12:50:09Z) - A high performance fingerprint liveness detection method based on
quality related features [66.41574316136379]
このシステムは、10,500枚以上の実画像と偽画像からなる非常に難しいデータベースでテストされている。
提案手法はマルチシナリオデータセットに対して堅牢であることが証明され、全体の90%が正しく分類されたサンプルである。
論文 参考訳(メタデータ) (2021-11-02T21:09:39Z) - On the Practicality of Deterministic Epistemic Uncertainty [106.06571981780591]
決定論的不確実性法(DUM)は,分布外データの検出において高い性能を達成する。
DUMが十分に校正されており、現実のアプリケーションにシームレスにスケールできるかどうかは不明だ。
論文 参考訳(メタデータ) (2021-07-01T17:59:07Z) - Multi-Loss Sub-Ensembles for Accurate Classification with Uncertainty
Estimation [1.2891210250935146]
本稿では,ディープニューラルネットワーク(DNN)の高精度な不確実性推定手法を提案する。
我々は,Deep-Sub-Ensembles法によって提案される利点を利用して,推定時間を比較的低く保つ。
その結果,いくつかの不確実性対策における分類課題と競争結果の精度が向上した。
論文 参考訳(メタデータ) (2020-10-05T10:59:11Z) - Data-Driven Assessment of Deep Neural Networks with Random Input
Uncertainty [14.191310794366075]
我々は,ネットワーク出力の安全性を同時に証明し,ローカライズ可能なデータ駆動最適化手法を開発した。
深部ReLUネットワークにおける提案手法の有効性とトラクタビリティを実験的に実証した。
論文 参考訳(メタデータ) (2020-10-02T19:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。