論文の概要: Independent evaluation of state-of-the-art deep networks for mammography
- arxiv url: http://arxiv.org/abs/2206.12407v1
- Date: Wed, 22 Jun 2022 15:56:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 01:22:38.611918
- Title: Independent evaluation of state-of-the-art deep networks for mammography
- Title(参考訳): マンモグラフィにおける最先端ディープネットワークの独立評価
- Authors: Osvaldo Matias Velarde and Lucas Parrra
- Abstract要約: 公開されている4つのマンモグラフィーデータセットを用いた5つの最先端モデルの性能評価を行った。
トレーニングされたモデルは、マンモグラフィー試験の標準的な4つのビューに基づいている場合を除いて、サンプル外のデータではうまく動作しなかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep neural models have shown remarkable performance in image recognition
tasks, whenever large datasets of labeled images are available. The largest
datasets in radiology are available for screening mammography. Recent reports,
including in high impact journals, document performance of deep models at or
above that of trained radiologists. What is not yet known is whether
performance of these trained models is robust and replicates across datasets.
Here we evaluate performance of five published state-of-the-art models on four
publicly available mammography datasets. The limited size of public datasets
precludes retraining the model and so we are limited to evaluate those models
that have been made available with pre-trained parameters. Where test data was
available, we replicated published results. However, the trained models
performed poorly on out-of-sample data, except when based on all four standard
views of a mammographic exam. We conclude that future progress will depend on a
concerted effort to make more diverse and larger mammography datasets publicly
available. Meanwhile, results that are not accompanied by a release of trained
models for independent validation should be judged cautiously.
- Abstract(参考訳): ディープニューラルモデルは、ラベル付き画像の大きなデータセットが利用できる場合、画像認識タスクにおいて顕著なパフォーマンスを示している。
放射線学における最大のデータセットはマンモグラフィのスクリーニングに利用できる。
近年の高影響誌等では、放射線科医による深部モデルの性能を文書化している。
まだ知られていないのは、これらのトレーニングされたモデルのパフォーマンスが堅牢で、データセット間で複製されるかどうかだ。
本稿では,公開されている4つのマンモグラフィデータセットを用いた5つの最新モデルの性能評価を行った。
パブリックデータセットの制限されたサイズは、モデルの再トレーニングを妨げるため、事前トレーニングされたパラメータで利用できるモデルを評価することに限定されます。
テストデータが利用可能であれば、公開結果を再現しました。
しかし、トレーニングされたモデルは、マンモグラフィー試験の標準的な4つのビューに基づいた場合を除き、サンプル外データでは不十分であった。
今後の進歩は、より多様で大きなマンモグラフィデータセットを一般公開するための協力的な取り組みにかかっていると結論づける。
一方、独立した検証のための訓練済みモデルのリリースを伴わない結果を慎重に判断する必要がある。
関連論文リスト
- Weakly supervised deep learning model with size constraint for prostate cancer detection in multiparametric MRI and generalization to unseen domains [0.90668179713299]
本モデルでは, 完全教師付きベースラインモデルにより, オンパー性能が向上することを示す。
また、未確認データドメインでテストした場合、完全に教師付きモデルと弱い教師付きモデルの両方のパフォーマンス低下も観察する。
論文 参考訳(メタデータ) (2024-11-04T12:24:33Z) - LiveXiv -- A Multi-Modal Live Benchmark Based on Arxiv Papers Content [62.816876067499415]
我々は、科学的ArXiv論文に基づくスケーラブルな進化型ライブベンチマークであるLiveXivを提案する。
LiveXivは、任意のタイムスタンプでドメイン固有の原稿にアクセスし、視覚的な問合せペアを自動的に生成することを提案する。
ベンチマークの最初のバージョンで、複数のオープンでプロプライエタリなLMM(Large Multi-modal Models)をベンチマークし、その挑戦的な性質を示し、モデルの真の能力を明らかにする。
論文 参考訳(メタデータ) (2024-10-14T17:51:23Z) - On the Out of Distribution Robustness of Foundation Models in Medical
Image Segmentation [47.95611203419802]
視覚と言語の基礎は、様々な自然画像とテキストデータに基づいて事前訓練されており、有望なアプローチとして現れている。
一般化性能を,同じ分布データセット上で微調整した後,事前学習した各種モデルの未確認領域と比較した。
さらに,凍結モデルに対する新しいベイズ不確実性推定法を開発し,分布外データに基づくモデルの性能評価指標として利用した。
論文 参考訳(メタデータ) (2023-11-18T14:52:10Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Quantifying Sample Anonymity in Score-Based Generative Models with
Adversarial Fingerprinting [3.8933108317492167]
プライベートデータ上での拡散モデルをトレーニングし、生データセットではなくモデルと重みを広めることで、革新的な大規模データ共有戦略の道を開く。
本稿では,サンプリング過程において,識別可能な訓練画像の再生確率の上限を推定する手法を提案する。
以上の結果から,モデルが不注意にトレーニングされた場合,プライバシブリーチング画像はサンプリング時に再生されることがわかった。
論文 参考訳(メタデータ) (2023-06-02T08:37:38Z) - Ambiguous Images With Human Judgments for Robust Visual Event
Classification [34.62731821199598]
我々はあいまいな画像のデータセットを作成し、それらをビデオから抽出したノイズの多い画像の集合であるSQUID-E(Squidy)を作成する。
すべての画像は、地上の真理値でアノテートされ、テストセットは、人間の不確実性判定でアノテートされる。
このデータセットを用いて、視覚タスクにおける人間の不確実性を特徴づけ、既存の視覚事象分類モデルを評価する。
論文 参考訳(メタデータ) (2022-10-06T17:52:20Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica [0.5541644538483946]
ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
論文 参考訳(メタデータ) (2021-07-24T22:26:50Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - On the Composition and Limitations of Publicly Available COVID-19 X-Ray
Imaging Datasets [0.0]
データ不足、トレーニングとターゲット人口のミスマッチ、グループ不均衡、ドキュメントの欠如は、バイアスの重要な原因である。
本稿では,現在公開されている新型コロナウイルス胸部X線データセットの概要を紹介する。
論文 参考訳(メタデータ) (2020-08-26T14:16:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。