論文の概要: ReXGradient-160K: A Large-Scale Publicly Available Dataset of Chest Radiographs with Free-text Reports
- arxiv url: http://arxiv.org/abs/2505.00228v1
- Date: Thu, 01 May 2025 00:29:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:55.191676
- Title: ReXGradient-160K: A Large-Scale Publicly Available Dataset of Chest Radiographs with Free-text Reports
- Title(参考訳): ReXGradient-160K: フリーテキストによる胸部X線画像の大規模公開データセット
- Authors: Xiaoman Zhang, Julián N. Acosta, Josh Miller, Ouwen Huang, Pranav Rajpurkar,
- Abstract要約: このデータセットには、米国の3つの医療システムにまたがる109,487人のユニークな患者から1万件の胸部X線研究とペアの放射線学的報告が含まれている。
この広範なデータセットを提供することで、医療画像AIの研究を加速し、自動放射線分析における最先端の進歩を目指す。
- 参考スコア(独自算出の注目度): 4.247428746963443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present ReXGradient-160K, representing the largest publicly available chest X-ray dataset to date in terms of the number of patients. This dataset contains 160,000 chest X-ray studies with paired radiological reports from 109,487 unique patients across 3 U.S. health systems (79 medical sites). This comprehensive dataset includes multiple images per study and detailed radiology reports, making it particularly valuable for the development and evaluation of AI systems for medical imaging and automated report generation models. The dataset is divided into training (140,000 studies), validation (10,000 studies), and public test (10,000 studies) sets, with an additional private test set (10,000 studies) reserved for model evaluation on the ReXrank benchmark. By providing this extensive dataset, we aim to accelerate research in medical imaging AI and advance the state-of-the-art in automated radiological analysis. Our dataset will be open-sourced at https://huggingface.co/datasets/rajpurkarlab/ReXGradient-160K.
- Abstract(参考訳): ReXGradient-160Kは,患者数ではこれまでで最大規模の胸部X線データセットである。
このデータセットには、米国の3つの医療システム(79の医療施設)にまたがる109,487人のユニークな患者からの放射線学的報告と、16万の胸部X線研究が含まれている。
この包括的なデータセットには、研究ごとの複数の画像と詳細な放射線学レポートが含まれており、医療画像と自動レポート生成モデルのためのAIシステムの開発と評価に特に有用である。
データセットはトレーニング(14万の研究)、検証(10,000の研究)、公開テスト(10,000の研究)のセットに分割され、ReXrankベンチマークのモデル評価のために追加のプライベートテストセット(10,000の研究)が予約されている。
この広範なデータセットを提供することで、医療画像AIの研究を加速し、自動放射線分析における最先端の進歩を目指す。
私たちのデータセットはhttps://huggingface.co/datasets/rajpurkarlab/ReXGradient-160Kでオープンソース化されます。
関連論文リスト
- ReXrank: A Public Leaderboard for AI-Powered Radiology Report Generation [16.687723916901728]
我々は、AIを利用した放射線学レポート生成を評価するためのリーダーボードで課題であるReXrankを紹介する。
このフレームワークには1万の研究からなる最大のテストデータセットであるReXGradientが組み込まれています。
この標準化された評価フレームワークを提供することで、ReXrankはモデルパフォーマンスの有意義な比較を可能にします。
論文 参考訳(メタデータ) (2024-11-22T18:40:02Z) - CheXpert Plus: Augmenting a Large Chest X-ray Dataset with Text Radiology Reports, Patient Demographics and Additional Image Formats [18.498344743909254]
CheXpert Plusは、放射線学で公開された最大のテキストデータセットである。
これは放射線学における最大のテキスト識別の取り組みである。
全てのレポートはDICOMフォーマットで高品質な画像とペアリングされる。
論文 参考訳(メタデータ) (2024-05-29T21:48:56Z) - Revisiting Computer-Aided Tuberculosis Diagnosis [56.80999479735375]
結核(TB)は世界的な健康上の脅威であり、毎年何百万人もの死者を出している。
深層学習を用いたコンピュータ支援結核診断 (CTD) は有望であるが, 限られたトレーニングデータによって進行が妨げられている。
結核X線(TBX11K)データセットは11,200個の胸部X線(CXR)画像とそれに対応するTB領域のバウンディングボックスアノテーションを含む。
このデータセットは、高品質なCTDのための洗練された検出器のトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-06T08:27:48Z) - Computer-aided Tuberculosis Diagnosis with Attribute Reasoning
Assistance [58.01014026139231]
新しい大規模結核(TB)胸部X線データセット(TBX-Att)を提案する。
属性情報を利用してTBの分類とローカライズを行うための属性支援弱教師付きフレームワークを構築した。
提案モデルはTBX-Attデータセットで評価され,今後の研究の確かなベースラインとして機能する。
論文 参考訳(メタデータ) (2022-07-01T07:50:35Z) - PediCXR: An open, large-scale chest radiograph dataset for
interpretation of common thoracic diseases in children [0.31317409221921133]
私たちは、2020年から2021年にかけて、ベトナムの大手小児病院から遡及的に収集された9,125の小児CXRデータセットであるPediCXRをリリースしました。
このデータセットは、36の重大な発見と15の疾患の存在のためにラベル付けされた。
論文 参考訳(メタデータ) (2022-03-20T18:03:11Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z) - The pitfalls of using open data to develop deep learning solutions for
COVID-19 detection in chest X-rays [64.02097860085202]
深層学習モデルは、胸部X線から新型コロナウイルスを識別するために開発された。
オープンソースデータのトレーニングやテストでは,結果は異例です。
データ分析とモデル評価は、人気のあるオープンソースデータセットであるCOVIDxが実際の臨床問題を代表していないことを示している。
論文 参考訳(メタデータ) (2021-09-14T10:59:11Z) - Is Medical Chest X-ray Data Anonymous? [8.29994774042507]
よく訓練された深層学習システムが胸部X線データから患者の身元を回復できることを示した。
大規模なChestX-ray14データセットを使用して、これを実証する。
論文 参考訳(メタデータ) (2021-03-15T17:26:43Z) - Creation and Validation of a Chest X-Ray Dataset with Eye-tracking and
Report Dictation for AI Development [47.1152650685625]
我々は、人工知能の研究者を支援するために、チェストX線(CXR)画像の豊富なデータセットを開発した。
データはアイトラッキングシステムを用いて収集され、放射線学者は1,083 CXR画像でレビューし報告した。
論文 参考訳(メタデータ) (2020-09-15T23:12:49Z) - Learning Invariant Feature Representation to Improve Generalization
across Chest X-ray Datasets [55.06983249986729]
我々は、トレーニングデータと同じデータセットでテストすると、ディープラーニングモデルが、異なるソースからデータセットでテストされると、パフォーマンスが低下し始めることを示す。
対戦型トレーニング戦略を用いることで、ネットワークはソース不変表現を学習せざるを得ないことを示す。
論文 参考訳(メタデータ) (2020-08-04T07:41:15Z) - Automated Radiological Report Generation For Chest X-Rays With
Weakly-Supervised End-to-End Deep Learning [17.315387269810426]
我々は12,000以上のCXRスキャンと放射線学的レポートを含むデータベースを構築した。
我々は,深層畳み込みニューラルネットワークとアテンション機構を持つリカレントネットワークに基づくモデルを開発した。
このモデルは、与えられたスキャンを自動的に認識し、レポートを生成する。
論文 参考訳(メタデータ) (2020-06-18T08:12:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。