論文の概要: Benchmarking the Robustness of Deep Neural Networks to Common
Corruptions in Digital Pathology
- arxiv url: http://arxiv.org/abs/2206.14973v1
- Date: Thu, 30 Jun 2022 01:53:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-01 13:37:25.026160
- Title: Benchmarking the Robustness of Deep Neural Networks to Common
Corruptions in Digital Pathology
- Title(参考訳): ディープニューラルネットワークのロバスト性とデジタル病理の共通破壊のベンチマーク
- Authors: Yunlong Zhang and Yuxuan Sun and Honglin Li and Sunyi Zheng and
Chenglu Zhu and Lin Yang
- Abstract要約: このベンチマークは、腐敗した病理画像に対して、ディープニューラルネットワークがどのように機能するかを評価するために確立されている。
2つの分類と1つのランキングのメトリクスは、汚職下での予測と信頼性のパフォーマンスを評価するために設計されている。
- 参考スコア(独自算出の注目度): 11.398235052118608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When designing a diagnostic model for a clinical application, it is crucial
to guarantee the robustness of the model with respect to a wide range of image
corruptions. Herein, an easy-to-use benchmark is established to evaluate how
deep neural networks perform on corrupted pathology images. Specifically,
corrupted images are generated by injecting nine types of common corruptions
into validation images. Besides, two classification and one ranking metrics are
designed to evaluate the prediction and confidence performance under
corruption. Evaluated on two resulting benchmark datasets, we find that (1) a
variety of deep neural network models suffer from a significant accuracy
decrease (double the error on clean images) and the unreliable confidence
estimation on corrupted images; (2) A low correlation between the validation
and test errors while replacing the validation set with our benchmark can
increase the correlation. Our codes are available on
https://github.com/superjamessyx/robustness_benchmark.
- Abstract(参考訳): 臨床応用のための診断モデルを設計する際には、幅広い画像の破損に関してモデルの堅牢性を保証することが不可欠である。
そこで, 難治な病理画像に対してディープニューラルネットワークがどのように機能するかを評価するために, 使いやすいベンチマークが確立された。
具体的には、検証画像に9種類の共通の腐敗を注入して破損画像を生成する。
また,2つの分類と1つのランキング指標は,腐敗下の予測と信頼度を評価するために設計されている。
その結果得られた2つのベンチマークデータセットで評価した結果,(1)様々な深層ニューラルネットワークモデルでは,高い精度低下(クリーンイメージの2倍の誤差)と劣化画像の信頼性の低下,(2)検証セットをベンチマークに置き換えた際の検証誤差とテストエラーとの相関の低さが相関性の向上に寄与することがわかった。
私たちのコードはhttps://github.com/superjamessyx/robustness_benchmarkで利用可能です。
関連論文リスト
- Frequency-Based Vulnerability Analysis of Deep Learning Models against
Image Corruptions [48.34142457385199]
MUFIAは、モデルが失敗する可能性のある特定の種類の汚職を特定するために設計されたアルゴリズムである。
最先端のモデルでさえ、既知の一般的な汚職に対して堅牢であるように訓練されたモデルでさえ、MUFIAによって作られた低視認性ベースの汚職と戦っている。
論文 参考訳(メタデータ) (2023-06-12T15:19:13Z) - DOMINO: Domain-aware Model Calibration in Medical Image Segmentation [51.346121016559024]
現代のディープニューラルネットワークはキャリブレーションが不十分で、信頼性と信頼性を損なう。
本稿では,クラスラベル間のセマンティック・コンフューザビリティと階層的類似性を利用したドメイン認識モデルキャリブレーション手法であるDOMINOを提案する。
その結果,DOMINOを校正したディープニューラルネットワークは,頭部画像分割における非校正モデルや最先端形態計測法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-13T15:31:52Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [55.52743265122446]
ディープオートエンコーダは視覚領域における異常検出のタスクに使われてきた。
我々は、訓練中に識別情報を使用することが可能な自己指導型学習体制を適用することで、この問題に対処する。
MVTec ADデータセットを用いた実験では,高い検出性能と局所化性能を示した。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Benchmarking Robustness of Deep Learning Classifiers Using Two-Factor
Perturbation [4.016928101928335]
本稿では,欠陥画像上のDL分類器のロバスト性を評価するための基礎的な研究を付け加える。
クリーンなセット,単一因子摂動のセット,2要素摂動条件のセットを含む,総合的な69のベンチマーク画像セットを作成しました。
論文 参考訳(メタデータ) (2022-03-02T03:53:21Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - Malware Detection Using Frequency Domain-Based Image Visualization and
Deep Learning [16.224649756613655]
画像分類によるマルウェアの検出と可視化を行う新しい手法を提案する。
実行可能なバイナリは、離散コサイン変換ドメイン内のバイトのNグラム(N=2)のカウントから得られるグレースケール画像として表現される。
浅いニューラルネットワークは分類のために訓練され、その精度は転送学習を用いて訓練されるresnetのようなディープネットワークアーキテクチャと比較される。
論文 参考訳(メタデータ) (2021-01-26T06:07:46Z) - Detecting Misclassification Errors in Neural Networks with a Gaussian
Process Model [20.948038514886377]
本稿では,誤分類誤りを検出するための定量的な尺度を新たに作成する枠組みを提案する。
このフレームワークREDは、ベース分類器の上にエラー検出器を構築し、ガウス過程を用いて検出スコアの不確かさを推定する。
論文 参考訳(メタデータ) (2020-10-05T15:01:30Z) - Inducing Predictive Uncertainty Estimation for Face Recognition [102.58180557181643]
顔画像の「マッドペア」から画像品質訓練データを自動的に生成する手法を提案する。
生成したデータを用いて、顔画像の信頼度を推定するために、PCNetと呼ばれる軽量な予測信頼ネットワークを訓練する。
論文 参考訳(メタデータ) (2020-09-01T17:52:00Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。