論文の概要: The EMory BrEast imaging Dataset (EMBED): A Racially Diverse, Granular
Dataset of 3.5M Screening and Diagnostic Mammograms
- arxiv url: http://arxiv.org/abs/2202.04073v1
- Date: Tue, 8 Feb 2022 14:40:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-11 07:19:26.963567
- Title: The EMory BrEast imaging Dataset (EMBED): A Racially Diverse, Granular
Dataset of 3.5M Screening and Diagnostic Mammograms
- Title(参考訳): emory breast imaging dataset (embed):3.5mスクリーニングおよび診断マンモグラムの人種的多様性と粒度データセット
- Authors: Jiwoong J. Jeong, Brianna L. Vey, Ananth Reddy, Thomas Kim, Thiago
Santos, Ramon Correa, Raman Dutt, Marina Mosunjac, Gabriela Oprea-Ilies,
Geoffrey Smith, Minjae Woo, Christopher R. McAdams, Mary S. Newell, Imon
Banerjee, Judy Gichoya, Hari Trivedi
- Abstract要約: EMory BrEast画像データセットには3650,000の2Dと診断用マンモグラフィーが含まれており、白人とアフリカ系アメリカ人の患者に等しく分けられている。
私たちの目標は、このデータセットを研究パートナーと共有し、すべての患者に公平に提供し、医療AIのバイアスを減らすための乳房AIモデルの開発と検証を支援することです。
- 参考スコア(独自算出の注目度): 2.243792799100692
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing and validating artificial intelligence models in medical imaging
requires datasets that are large, granular, and diverse. To date, the majority
of publicly available breast imaging datasets lack in one or more of these
areas. Models trained on these data may therefore underperform on patient
populations or pathologies that have not previously been encountered. The EMory
BrEast imaging Dataset (EMBED) addresses these gaps by providing 3650,000 2D
and DBT screening and diagnostic mammograms for 116,000 women divided equally
between White and African American patients. The dataset also contains 40,000
annotated lesions linked to structured imaging descriptors and 61 ground truth
pathologic outcomes grouped into six severity classes. Our goal is to share
this dataset with research partners to aid in development and validation of
breast AI models that will serve all patients fairly and help decrease bias in
medical AI.
- Abstract(参考訳): 医療画像における人工知能モデルの開発と検証には、大きくて粒状で多様なデータセットが必要である。
現在までに、公開されている乳房画像データセットの大部分は、これらの領域の1つ以上の欠如を欠いている。
したがって、これらのデータに基づいて訓練されたモデルは、これまで遭遇したことのない患者集団や病理に不適合である可能性がある。
EMory BrEast Imaging Dataset (EMBED)は、白人とアフリカ系アメリカ人の患者に均等に分けた116,000人の女性に対して3650,000の2DおよびDBTスクリーニングと診断用マンモグラムを提供することで、これらのギャップに対処している。
データセットには、構造化画像記述子と関連づけられた4万の注釈付き病変と、6つの重度クラスに分類された61の基底真理の病理結果が含まれている。
私たちの目標は、このデータセットを研究パートナーと共有し、すべての患者に公平に提供し、医療AIのバイアスを減らすための乳房AIモデルの開発と検証を支援することです。
関連論文リスト
- HIST-AID: Leveraging Historical Patient Reports for Enhanced Multi-Modal Automatic Diagnosis [38.13689106933105]
HIST-AIDは,過去の報告から自動診断精度を高めるフレームワークである。
AUROCは6.56%増加し、AUPRCは9.51%向上した。
論文 参考訳(メタデータ) (2024-11-16T03:20:53Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - RadGenome-Chest CT: A Grounded Vision-Language Dataset for Chest CT Analysis [56.57177181778517]
RadGenome-Chest CTはCT-RATEに基づく大規模3次元胸部CT解釈データセットである。
私たちは、最新の強力なユニバーサルセグメンテーションと大きな言語モデルを活用して、元のデータセットを拡張します。
論文 参考訳(メタデータ) (2024-04-25T17:11:37Z) - Demographic Bias of Expert-Level Vision-Language Foundation Models in
Medical Imaging [13.141767097232796]
自己監督型視覚言語基盤モデルは、明示的なトレーニングアノテーションに頼ることなく、幅広い病態を検出することができる。
これらのAIモデルが人間の偏見を反映または増幅しないことを保証することが不可欠である。
本研究では,5つのグローバルソースデータセットを対象とした胸部X線診断における最先端の視覚言語基盤モデルのアルゴリズム的公正性について検討した。
論文 参考訳(メタデータ) (2024-02-22T18:59:53Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Generative models improve fairness of medical classifiers under
distribution shifts [49.10233060774818]
データから現実的な拡張を自動的に学習することは、生成モデルを用いてラベル効率の良い方法で可能であることを示す。
これらの学習の強化は、モデルをより堅牢で統計的に公平に配布できることを示した。
論文 参考訳(メタデータ) (2023-04-18T18:15:38Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Detection of masses and architectural distortions in digital breast
tomosynthesis: a publicly available dataset of 5,060 patients and a deep
learning model [4.3359550072619255]
乳房トモシンセシス画像の大規模データセットをキュレートし,公開している。
5,060人の患者から5,610人を対象にした22,032冊の復元版がある。
我々は単相深層学習検出モデルを開発し、将来の研究のベースラインとしてデータセットを用いてテストした。
論文 参考訳(メタデータ) (2020-11-13T18:33:31Z) - OPTIMAM Mammography Image Database: a large scale resource of
mammography images and clinical data [0.2600410195810869]
医療画像研究の大きな障壁は、他の研究者と画像を共有する医療画像の大規模なデータベースがないことである。
OPTIMAM画像データベース(OMI-DB)は,これらの障壁を克服するために開発された。
このデータベースには、イギリスの3つの乳房検診センターから集めた173,319人の女性の画像が250万枚以上含まれている。
論文 参考訳(メタデータ) (2020-04-09T17:12:13Z) - Heterogeneity Loss to Handle Intersubject and Intrasubject Variability
in Cancer [11.440201348567681]
深層学習(DL)モデルは、医学領域において顕著な結果を示している。
これらのAI手法は、開発途上国に安価な医療ソリューションとして大きな支援を提供することができる。
この研究は、そのような血液がん診断の応用に焦点をあてている。
論文 参考訳(メタデータ) (2020-03-06T16:16:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。