論文の概要: Few Shot Learning Framework to Reduce Inter-observer Variability in
Medical Images
- arxiv url: http://arxiv.org/abs/2008.02952v1
- Date: Fri, 7 Aug 2020 02:05:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 00:44:03.111928
- Title: Few Shot Learning Framework to Reduce Inter-observer Variability in
Medical Images
- Title(参考訳): 医用画像におけるオブザーバ間変動を低減するためのショット学習フレームワーク
- Authors: Sohini Roychowdhury
- Abstract要約: 大量のアノテートされた医用画像データを保証する品質は主観的で高価である。
本稿では、3つのFSLモデルを実装した新しい標準化フレームワークを提案する。
また,手動でアノテートしたターゲットラベルとRPの相対的一致性を測定する新たなターゲットラベル選択アルゴリズム (TLSA) を提案する。
- 参考スコア(独自算出の注目度): 1.2335698325757494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most computer aided pathology detection systems rely on large volumes of
quality annotated data to aid diagnostics and follow up procedures. However,
quality assuring large volumes of annotated medical image data can be
subjective and expensive. In this work we present a novel standardization
framework that implements three few-shot learning (FSL) models that can be
iteratively trained by atmost 5 images per 3D stack to generate multiple
regional proposals (RPs) per test image. These FSL models include a novel
parallel echo state network (ParESN) framework and an augmented U-net model.
Additionally, we propose a novel target label selection algorithm (TLSA) that
measures relative agreeability between RPs and the manually annotated target
labels to detect the "best" quality annotation per image. Using the FSL models,
our system achieves 0.28-0.64 Dice coefficient across vendor image stacks for
intra-retinal cyst segmentation. Additionally, the TLSA is capable of
automatically classifying high quality target labels from their noisy
counterparts for 60-97% of the images while ensuring manual supervision on
remaining images. Also, the proposed framework with ParESN model minimizes
manual annotation checking to 12-28% of the total number of images. The TLSA
metrics further provide confidence scores for the automated annotation quality
assurance. Thus, the proposed framework is flexible to extensions for quality
image annotation curation of other image stacks as well.
- Abstract(参考訳): ほとんどのコンピュータ支援病理検出システムは、診断とフォローアップの手順を支援するために、大量の品質アノテートデータに依存している。
しかし、大量の注釈付き医用画像データを保証する品質は主観的でコストがかかる。
本研究では,3Dスタック毎に少なくとも5つの画像で反復的にトレーニングし,複数の領域提案(RP)を生成することのできる3つのFSLモデルを実装した新しい標準化フレームワークを提案する。
これらのFSLモデルは、新しい並列エコー状態ネットワーク(ParESN)フレームワークと拡張U-netモデルを含んでいる。
さらに,rpsと手作業でアノテートされたターゲットラベル間の相対的適合性を測定し,画像当たりの「最高の」品質アノテーションを検出する新しいターゲットラベル選択アルゴリズム(tlsa)を提案する。
FSLモデルを用いて,網膜内嚢胞分画のためのベンダーイメージスタック間で0.28-0.64Dice係数を実現する。
さらに、TLSAは、ノイズの多いラベルから高品質なターゲットラベルを60~97%のイメージで自動的に分類し、残りのイメージを手動で監督する。
また、paresnモデルを用いた提案フレームワークは、画像総数の12-28%まで手動アノテーションチェックを最小化する。
TLSAメトリクスはさらに、自動アノテーション品質保証の信頼性スコアを提供する。
したがって、提案フレームワークは、他の画像スタックの良質な画像アノテーションキュレーションの拡張にも柔軟である。
関連論文リスト
- Image2Sentence based Asymmetrical Zero-shot Composed Image Retrieval [92.13664084464514]
合成画像検索(CIR)の課題は,検索画像とユーザの意図を記述したテキストに基づいて画像を取得することである。
既存の手法は、CIRタスクにおける高度な大規模視覚言語(VL)モデルにおいて大きな進歩を遂げているが、それらは一般的に、モデルトレーニングのためのラベル付き三重項の欠如とリソース制限された環境への展開の困難という2つの大きな問題に悩まされている。
本稿では、VLモデルを利用して合成学習のためのラベルなし画像のみに依存する画像2Sentenceに基づく非対称ゼロショット合成画像検索(ISA)を提案する。
論文 参考訳(メタデータ) (2024-03-03T07:58:03Z) - Diversified in-domain synthesis with efficient fine-tuning for few-shot
classification [64.86872227580866]
画像分類は,クラスごとのラベル付き例の小さなセットのみを用いて,画像分類器の学習を目的としている。
合成データを用いた数ショット学習における一般化問題に対処する新しいアプローチである DisEF を提案する。
提案手法を10種類のベンチマークで検証し,ベースラインを一貫して上回り,数ショット分類のための新しい最先端の手法を確立した。
論文 参考訳(メタデータ) (2023-12-05T17:18:09Z) - Self-supervised Few-shot Learning for Semantic Segmentation: An
Annotation-free Approach [4.855689194518905]
Few-shot semantic segmentation (FSS)は、医用画像解析の分野で大きな可能性を秘めている。
既存のFSS技術は注釈付きセマンティッククラスに大きく依存しており、医療画像には適さない。
本稿では,アノテーションに依存しない新たな自己教師型FSSフレームワークを提案する。その代わりに,支援画像から得られる固有ベクトルを利用して,クエリマスクを適応的に推定する。
論文 参考訳(メタデータ) (2023-07-26T18:33:30Z) - Learning Self-Supervised Representations for Label Efficient
Cross-Domain Knowledge Transfer on Diabetic Retinopathy Fundus Images [2.796274924103132]
本研究は,糖尿病網膜症 (DR) 画像をドメイン横断設定で分類するための,自己教師付き表現学習に基づく新しいアプローチを提案する。
提案手法は,クロスドメイン設定においても,DR画像の2値化と多値化の最先端化を実現する。
論文 参考訳(メタデータ) (2023-04-20T12:46:34Z) - Zero-shot Model Diagnosis [80.36063332820568]
ディープラーニングモデルを評価するための一般的なアプローチは、興味のある属性を持つラベル付きテストセットを構築し、そのパフォーマンスを評価することである。
本稿では,ゼロショットモデル診断(ZOOM)がテストセットやラベル付けを必要とせずに可能であることを論じる。
論文 参考訳(メタデータ) (2023-03-27T17:59:33Z) - PCRLv2: A Unified Visual Information Preservation Framework for
Self-supervised Pre-training in Medical Image Analysis [56.63327669853693]
本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。
また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。
提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
論文 参考訳(メタデータ) (2023-01-02T17:47:27Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Visual Representation Learning with Self-Supervised Attention for
Low-Label High-data Regime [0.41998444721319217]
自己監督型ビジョントランスフォーマー(SSL-ViT)は、低ラベルで高データ状態の2つの重要なコンピュータビジョンタスクに適応することができる。
数ショットのイメージ分類では、SSL-ViTを外部データに監視せずにトレーニングし、このトレーニング済み埋め込みを使用して、ラベル数が限られている新しいクラスに迅速に適応します。
ゼロショット画像検索には、ラベルのない大規模なデータセットで事前トレーニングされたSSL-ViTを使用し、いくつかのメトリック学習目標でそれらを微調整する。
論文 参考訳(メタデータ) (2022-01-22T02:37:07Z) - Semi-weakly Supervised Contrastive Representation Learning for Retinal
Fundus Images [0.2538209532048867]
本稿では,半弱化アノテーションを用いた表現学習のための,半弱化教師付きコントラスト学習フレームワークを提案する。
SWCLの移動学習性能を7つの公立網膜眼底データセットで実証的に検証した。
論文 参考訳(メタデータ) (2021-08-04T15:50:09Z) - Modeling the Probabilistic Distribution of Unlabeled Data forOne-shot
Medical Image Segmentation [40.41161371507547]
我々は1ショットの脳磁気共鳴画像(MRI)画像分割のためのデータ拡張法を開発した。
提案手法は,MRI画像1枚(atlas)とラベルなし画像数枚のみを利用する。
本手法は最先端のワンショット医療セグメンテーション法より優れている。
論文 参考訳(メタデータ) (2021-02-03T12:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。