論文の概要: ReXGroundingCT: A 3D Chest CT Dataset for Segmentation of Findings from Free-Text Reports
- arxiv url: http://arxiv.org/abs/2507.22030v2
- Date: Mon, 27 Oct 2025 17:51:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 19:54:32.407647
- Title: ReXGroundingCT: A 3D Chest CT Dataset for Segmentation of Findings from Free-Text Reports
- Title(参考訳): ReXGroundingCT: フリーテキストレポートからの検索のセグメンテーションのための3次元胸部CTデータセット
- Authors: Mohammed Baharoon, Luyang Luo, Michael Moritz, Abhinav Kumar, Sung Eun Kim, Xiaoman Zhang, Miao Zhu, Mahmoud Hussain Alabbad, Maha Sbayel Alhazmi, Neel P. Mistry, Lucas Bijnens, Kent Ryan Kleinschmidt, Brady Chrisler, Sathvik Suryadevara, Sri Sai Dinesh Jaliparthi, Noah Michael Prudlo, Mark David Marino, Jeremy Palacio, Rithvik Akula, Di Zhou, Hong-Yu Zhou, Ibrahim Ethem Hamamci, Scott J. Adams, Hassan Rayhan AlOmaish, Pranav Rajpurkar,
- Abstract要約: ReXGroundingCTは,胸部CTスキャンにおいて,自由テキスト所見とピクセルレベルの3Dセグメンテーションをリンクする最初の公開データセットである。
データセットには、CT-RATEの標準化された放射線学レポートと組み合わせた3,142個の非コントラスト胸部CTスキャンが含まれている。
約79%が焦点異常、21%が非焦点性である。
- 参考スコア(独自算出の注目度): 23.716614736159034
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce ReXGroundingCT, the first publicly available dataset linking free-text findings to pixel-level 3D segmentations in chest CT scans. The dataset includes 3,142 non-contrast chest CT scans paired with standardized radiology reports from CT-RATE. Construction followed a structured three-stage pipeline. First, GPT-4 was used to extract and standardize findings, descriptors, and metadata from reports originally written in Turkish and machine-translated into English. Second, GPT-4o-mini categorized each finding into a hierarchical ontology of lung and pleural abnormalities. Third, 3D annotations were produced for all CT volumes: the training set was quality-assured by board-certified radiologists, and the validation and test sets were fully annotated by board-certified radiologists. Additionally, a complementary chain-of-thought dataset was created to provide step-by-step hierarchical anatomical reasoning for localizing findings within the CT volume, using GPT-4o and localization coordinates derived from organ segmentation models. ReXGroundingCT contains 16,301 annotated entities across 8,028 text-to-3D-segmentation pairs, covering diverse radiological patterns from 3,142 non-contrast CT scans. About 79% of findings are focal abnormalities and 21% are non-focal. The dataset includes a public validation set of 50 cases and a private test set of 100 cases, both annotated by board-certified radiologists. The dataset establishes a foundation for enabling free-text finding segmentation and grounded radiology report generation in CT imaging. Model performance on the private test set is hosted on a public leaderboard at https://rexrank.ai/ReXGroundingCT. The dataset is available at https://huggingface.co/datasets/rajpurkarlab/ReXGroundingCT.
- Abstract(参考訳): ReXGroundingCTは,胸部CTスキャンにおいて,自由テキスト所見とピクセルレベルの3Dセグメンテーションをリンクする最初の公開データセットである。
データセットには、CT-RATEの標準化された放射線学レポートと組み合わせた3,142個の非コントラスト胸部CTスキャンが含まれている。
建設は構造化された3段パイプラインを踏襲した。
まず、GPT-4はトルコ語で書かれ、機械で英語に翻訳されたレポートから、発見、記述子、メタデータを抽出し、標準化するために使用された。
第2に,GPT-4o-miniは肺と胸膜異常の階層的オントロジーに分類した。
第3に3Dアノテーションは全CTボリュームに対して作成され, トレーニングセットは放射線技師によって品質保証され, 検証セットと検査セットは放射線医によって完全に注釈付けされた。
さらに,GPT-4oと臓器分節モデルから得られた局所化座標を用いて,CTボリューム内の所見の局在化のための階層的解剖学的段階的なステップバイステップを提供するために,補足的チェーン・オブ・シントデータセットが作成された。
ReXGroundingCTには8,028個のテキストから3Dのセグメンテーションペアに16,301個の注釈付きエンティティが含まれており、3,142個の非コントラストCTスキャンから様々な放射線学的パターンをカバーしている。
約79%が焦点異常、21%が非焦点性である。
データセットには、50ケースの公開検証セットと100ケースのプライベートテストセットが含まれており、どちらも、ボード認証された放射線学者によって注釈付けされている。
このデータセットは、CT画像における自由テキスト発見セグメンテーションとグラウンドドラジオロジーレポート生成を可能にする基盤を確立する。
プライベートテストセットのモデルパフォーマンスは、https://rexrank.ai/ReXGroundingCT.comの公開リーダボードにホストされている。
データセットはhttps://huggingface.co/datasets/rajpurkarlab/ReXGroundingCTで公開されている。
関連論文リスト
- Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach [57.86418347491272]
全身に404例の異常所見を呈する包括的階層分類システムを提案する。
複数平面および全人体領域からの14.5K以上のCT画像を含むデータセットを寄贈し,19K以上の異常に対する接地アノテーションを念頭に提供した。
OminiAbnorm-CTは,テキストクエリに基づいて,多面的および全身的なCT画像に異常な所見を自動的に検出し,記述することができる。
論文 参考訳(メタデータ) (2025-06-03T17:57:34Z) - CT-Agent: A Multimodal-LLM Agent for 3D CT Radiology Question Answering [23.158482226185217]
放射線科医のCTスキャンにおける解剖学的領域に関する質問に答える視覚的質問応答システム(VQA)が必要不可欠である。
既存のVQAシステムは,(1)解剖学的複雑性によりCT画像の理解が困難になる; (2) 数百スライス間の空間的関係の把握が困難である,といった課題に対して,CTラジオロジー質問応答(CTQA)タスクを適切に処理することはできない。
本稿では,CTQAのためのマルチモーダルエージェントフレームワークであるCT-Agentを提案する。
論文 参考訳(メタデータ) (2025-05-22T04:59:20Z) - Shadow and Light: Digitally Reconstructed Radiographs for Disease Classification [8.192975020366777]
DRR-RATEは、21,304人のユニークな患者から50,188個の前方デジタル再構成ラジオグラフィー(DRR)から構成される。
各画像は、対応する放射線学テキストレポートと18の病理学クラスのためのバイナリラベルとがペアリングされる。
我々は,既存の大規模胸部X線リソース,特にCheXpertデータセットとCheXnetモデルと併用して,DRR-RATEの適用性を示す。
論文 参考訳(メタデータ) (2024-06-06T02:19:18Z) - RadGenome-Chest CT: A Grounded Vision-Language Dataset for Chest CT Analysis [56.57177181778517]
RadGenome-Chest CTはCT-RATEに基づく大規模3次元胸部CT解釈データセットである。
私たちは、最新の強力なユニバーサルセグメンテーションと大きな言語モデルを活用して、元のデータセットを拡張します。
論文 参考訳(メタデータ) (2024-04-25T17:11:37Z) - Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography [10.110878689623961]
我々は3次元医用画像と対応するテキストレポートとをマッチングする最初のデータセットであるCT-RATEを紹介する。
我々はCTに焦点を当てたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。
我々は3次元胸部CTボリュームのための視覚言語基礎チャットモデルであるCT-CHATを作成する。
論文 参考訳(メタデータ) (2024-03-26T16:19:56Z) - Accurate Fine-Grained Segmentation of Human Anatomy in Radiographs via
Volumetric Pseudo-Labeling [66.75096111651062]
我々は,10,021個の胸部CTと157個のラベルの大規模データセットを作成した。
解剖学的擬似ラベル抽出のために3次元解剖分類モデルのアンサンブルを適用した。
得られたセグメンテーションモデルはCXRで顕著な性能を示した。
論文 参考訳(メタデータ) (2023-06-06T18:01:08Z) - Medical Image Captioning via Generative Pretrained Transformers [57.308920993032274]
我々は、Show-Attend-Tell と GPT-3 という2つの言語モデルを組み合わせて、包括的で記述的な放射線学記録を生成する。
提案モデルは、Open-I、MIMIC-CXR、汎用MS-COCOの2つの医療データセットで検証される。
論文 参考訳(メタデータ) (2022-09-28T10:27:10Z) - COVIDx CT-3: A Large-scale, Multinational, Open-Source Benchmark Dataset
for Computer-aided COVID-19 Screening from Chest CT Images [82.74877848011798]
胸部CT画像から新型コロナウイルスの症例を検出するための大規模ベンチマークデータセットであるCOVIDx CT-3を紹介する。
COVIDx CT-3には、少なくとも17カ国で6,068人の患者から431,205個のCTスライスが含まれている。
我々は, COVIDx CT-3データセットのデータ多様性と潜在的なバイアスについて検討し, 地理的, 集団的不均衡について検討した。
論文 参考訳(メタデータ) (2022-06-07T06:35:48Z) - COVID-19 Detection in Computed Tomography Images with 2D and 3D
Approaches [0.0]
本稿では,スライスベース(2D)とボリュームベース(3D)を組み合わせた,新型コロナウイルス感染症検出のための深層学習アンサンブルを提案する。
提案されたアンサンブルはIST-CovNetと呼ばれ、IST-Cデータセットで90.80%の精度と0.95のAUCスコアを得る。
Istanbul University Cerrahpasa School of Medicineで運用されている。
論文 参考訳(メタデータ) (2021-05-16T20:12:02Z) - A Structure-Aware Relation Network for Thoracic Diseases Detection and
Segmentation [63.76299770460766]
胸部x線画像の自動診断には胸部疾患や異常のインスタンスレベル検出と分割が不可欠である。
Mask R-CNNを拡張した構造認識関係ネットワーク(SAR-Net)を提案する。
ChestX-Detは、インスタンスレベルのアノテーション(ボックスとマスク)を備えた胸部X線データセットです。
論文 参考訳(メタデータ) (2021-04-21T02:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。