論文の概要: Augmenting Chest X-ray Datasets with Non-Expert Annotations
- arxiv url: http://arxiv.org/abs/2309.02244v2
- Date: Tue, 04 Mar 2025 13:04:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:10:26.958019
- Title: Augmenting Chest X-ray Datasets with Non-Expert Annotations
- Title(参考訳): 非拡張アノテーションによる胸部X線データセットの増大
- Authors: Veronika Cheplygina, Cathrine Damgaard, Trine Naja Eriksen, Dovile Juodelyte, Amelia Jiménez-Sánchez,
- Abstract要約: 非専門的アノテーションを組み込むことで,2つの公開胸部X線データセットを強化する。
専門家ラベルによく一般化する非専門アノテーションで胸部ドレイン検出器を訓練する。
本研究は,基礎的真理アノテーションの品質に対する意識を高めるための病理学的合意研究である。
- 参考スコア(独自算出の注目度): 1.8634335258003092
- License:
- Abstract: The advancement of machine learning algorithms in medical image analysis requires the expansion of training datasets. A popular and cost-effective approach is automated annotation extraction from free-text medical reports, primarily due to the high costs associated with expert clinicians annotating medical images, such as chest X-rays. However, it has been shown that the resulting datasets are susceptible to biases and shortcuts. Another strategy to increase the size of a dataset is crowdsourcing, a widely adopted practice in general computer vision with some success in medical image analysis. In a similar vein to crowdsourcing, we enhance two publicly available chest X-ray datasets by incorporating non-expert annotations. However, instead of using diagnostic labels, we annotate shortcuts in the form of tubes. We collect 3.5k chest drain annotations for NIH-CXR14, and 1k annotations for four different tube types in PadChest, and create the Non-Expert Annotations of Tubes in X-rays (NEATX) dataset. We train a chest drain detector with the non-expert annotations that generalizes well to expert labels. Moreover, we compare our annotations to those provided by experts and show "moderate" to "almost perfect" agreement. Finally, we present a pathology agreement study to raise awareness about the quality of ground truth annotations. We make our dataset available at https://zenodo.org/records/14944064 and our code available at https://github.com/purrlab/chestxr-label-reliability.
- Abstract(参考訳): 医用画像解析における機械学習アルゴリズムの進歩には、トレーニングデータセットの拡張が必要である。
一般的で費用対効果の高いアプローチは、フリーテキストの医療報告から自動的なアノテーション抽出であり、主に胸部X線などの医用画像に注釈をつける専門医のコストが高いためである。
しかし、結果として得られたデータセットはバイアスやショートカットの影響を受けやすいことが示されている。
データセットのサイズを拡大するもう1つの戦略はクラウドソーシングであり、一般的なコンピュータビジョンにおいて広く採用されており、医療画像解析に成功している。
クラウドソーシングと同じような形で、非専門家アノテーションを組み込むことで、公開の胸部X線データセットを2つ拡張する。
しかし,診断ラベルの代わりに,管の形でショートカットを注記する。
我々は, NIH-CXR14の3.5k胸部ドレインアノテーションとPadChestの4種類のチューブタイプに対する1kアノテーションを収集し, NEATXデータセットにNon-Expert Annotations of Tubes(Non-Expert Annotations of tubes in X-rays)を作成する。
専門家ラベルによく一般化する非専門アノテーションで胸部ドレイン検出器を訓練する。
さらに、アノテーションを専門家が提供したアノテーションと比較し、"モデレート"と"ほぼ完璧な"合意を示します。
最後に,基礎的真理アノテーションの品質に対する意識を高めるための病理学的合意研究について述べる。
データセットはhttps://zenodo.org/records/14944064で、コードはhttps://github.com/purrlab/chestxr-label-reliabilityで利用可能です。
関連論文リスト
- Augmentation Matters: A Mix-Paste Method for X-Ray Prohibited Item Detection under Noisy Annotations [52.065764858163476]
公共の安全のためには、自動X線禁止アイテム検出が不可欠である。
既存のディープラーニングベースの手法はすべて、X線画像のトレーニングのアノテーションが正しいことを前提としている。
ラベル対応混合パッチペースト増量法(Mix-Paste)を提案する。
我々は,ノイズの多いアノテーションの下で,X線データセット上での手法の優位性を示す。
論文 参考訳(メタデータ) (2025-01-03T09:51:51Z) - Annotator Consensus Prediction for Medical Image Segmentation with
Diffusion Models [70.3497683558609]
医療画像のセグメンテーションにおける大きな課題は、複数の専門家が提供したアノテーションにおける、サーバ間の大きなばらつきである。
拡散モデルを用いたマルチエキスパート予測のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-15T10:01:05Z) - Detecting Shortcuts in Medical Images -- A Case Study in Chest X-rays [0.22940141855172028]
2つの公開データセットを用いた胸部X線症例について検討した。
気胸画像のサブセットに対するアノテーションをドレインで共有する。
論文 参考訳(メタデータ) (2022-11-08T14:36:33Z) - Improving Radiology Summarization with Radiograph and Anatomy Prompts [60.30659124918211]
本稿では,印象生成を促進するために,新しい解剖学的拡張型マルチモーダルモデルを提案する。
より詳しくは、まず、解剖学を抽出する一連のルールを構築し、各文にこれらのプロンプトを配置し、解剖学的特徴を強調する。
コントラスト学習モジュールを用いて、これらの2つの表現を全体レベルで整列させ、コアテンションを用いて文レベルで融合させる。
論文 参考訳(メタデータ) (2022-10-15T14:05:03Z) - Did You Get What You Paid For? Rethinking Annotation Cost of Deep
Learning Based Computer Aided Detection in Chest Radiographs [8.079269139747131]
データアノテーションのコストが最終的にコンピュータ支援検出モデルの性能に与える影響について検討する。
コスト効率のよいアノテーションは、大量のアノテーションを収集すると大きな価値をもたらし、ゴールドスタンダードアノテーションのみで訓練されたモデルと比較して競争性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-09-30T08:42:22Z) - Breaking with Fixed Set Pathology Recognition through Report-Guided
Contrastive Training [23.506879497561712]
我々は、非構造化医療報告から直接概念を学ぶために、対照的なグローバルローカルなデュアルエンコーダアーキテクチャを採用している。
疾患分類のための大規模胸部X線データセットMIMIC-CXR,CheXpert,ChestX-Ray14について検討した。
論文 参考訳(メタデータ) (2022-05-14T21:44:05Z) - Cross-Modal Contrastive Learning for Abnormality Classification and
Localization in Chest X-rays with Radiomics using a Feedback Loop [63.81818077092879]
医療画像のためのエンドツーエンドのセミスーパーバイスドクロスモーダルコントラスト学習フレームワークを提案する。
まず、胸部X線を分類し、画像特徴を生成するために画像エンコーダを適用する。
放射能の特徴は別の専用エンコーダを通過し、同じ胸部x線から生成された画像の特徴の正のサンプルとして機能する。
論文 参考訳(メタデータ) (2021-04-11T09:16:29Z) - Cascaded Robust Learning at Imperfect Labels for Chest X-ray
Segmentation [61.09321488002978]
不完全アノテーションを用いた胸部X線分割のための新しいカスケードロバスト学習フレームワークを提案する。
モデルは3つの独立したネットワークから成り,ピアネットワークから有用な情報を効果的に学習できる。
提案手法は,従来の手法と比較して,セグメント化タスクの精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-04-05T15:50:16Z) - A Relational-learning Perspective to Multi-label Chest X-ray
Classification [1.4489463428855132]
胸部x線画像のマルチラベル分類は判別的手法を用いて頻繁に行われる。
マルチラベル分類の新たな知識グラフ再構成を提案する。
論文 参考訳(メタデータ) (2021-03-10T17:44:59Z) - Crowdsourcing Airway Annotations in Chest Computed Tomography Images [3.862190309412109]
胸部CT検査における気道計測は嚢胞性線維症などの疾患の鑑別に重要である。
機械学習アルゴリズムは代替手段を提供するが、優れたパフォーマンスを得るためには大量の注釈付きスキャンを必要とする。
我々は,24人の被験者に既知の気道の場所を画像スライスし,観衆に気道の壁の概略を依頼する。
論文 参考訳(メタデータ) (2020-11-20T14:54:32Z) - Do Public Datasets Assure Unbiased Comparisons for Registration
Evaluation? [96.53940048041248]
画像誘導神経外科医の登録をベンチマークするために、2つのデータセットで手動で注釈付けされたランドマークをスクリーニングするために、ヴァリグラムを使用します。
Variograms を用いて, 潜在的に有意な症例を同定し, 経験者により検討した。
論文 参考訳(メタデータ) (2020-03-20T20:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。