論文の概要: Universal CT Representations from Anatomy to Disease Phenotype through Agglomerative Pretraining
- arxiv url: http://arxiv.org/abs/2605.21906v2
- Date: Fri, 22 May 2026 02:24:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 14:44:53.766395
- Title: Universal CT Representations from Anatomy to Disease Phenotype through Agglomerative Pretraining
- Title(参考訳): アグロメリックプレトレーニングによる解剖学から病原体への普遍的CT表現
- Authors: Yuheng Li, Yuan Gao, Haoyu Dong, Yuxiang Lai, Shansong Wang, Mojtaba Safari, James E. Baciak, Xiaofeng Yang,
- Abstract要約: FlexiCTは266,227個のCTボリュームの集合的継続事前トレーニングによって訓練されたCT基盤モデルのファミリーである。
このトレーニング戦略はスライスレベル、ボリュームレベル、視覚言語分析をサポートする。
- 参考スコア(独自算出の注目度): 20.089063108862995
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computed tomography (CT) is a central to three-dimensional medical imaging, yet CT-based artificial intelligence remains fragmented across task-specific models for segmentation, classification, registration, and report analysis. Here we present FlexiCT, a family of CT foundation models trained by agglomerative continual pretraining on 266,227 CT volumes from 56 publicly available datasets, forming a large-scale public resource for CT representation learning. FlexiCT uses agglomerative pretraining across three stages: two-dimensional axial pretraining, three-dimensional anatomical pretraining and report-guided semantic alignment. This training strategy supports slice-level, volume-level and vision-language analysis. Across five downstream task families (segmentation, classification, registration, vision-language understanding and clinical retrieval), FlexiCT matches or exceeds prior task-specific approaches on multiple benchmarks. Its embeddings further organize CT scans along gradients associated with various tumor stages, suggesting that CT foundation models can capture imaging features relevant to disease phenotype characterization. Project page and code are available at: https://ricklisz.github.io/flexict.github.io and https://github.com/ricklisz/FlexiCT.
- Abstract(参考訳): CT(Computed tomography)は3次元の医用画像の中心であるが、CTベースの人工知能は、セグメンテーション、分類、登録、レポート分析のためのタスク固有のモデルで断片化されている。
ここでは、56の公開データセットから266,227のCTボリュームを集約的プレトレーニングによりトレーニングしたCT基礎モデルの家系であるFlexiCTを紹介し、CT表現学習のための大規模な公開リソースを形成する。
FlexiCTは2次元軸前訓練、3次元解剖学前訓練、レポート誘導セマンティックアライメントの3段階にわたる凝集前訓練を使用している。
このトレーニング戦略はスライスレベル、ボリュームレベル、視覚言語分析をサポートする。
5つの下流タスクファミリ(分類、分類、登録、視覚言語理解、臨床検索)にまたがってFlexiCTは、複数のベンチマークで以前のタスク固有のアプローチに適合するか、あるいは超えている。
その埋め込みは、様々な腫瘍ステージに関連する勾配に沿ってCTスキャンを整理し、CT基盤モデルが疾患の表現型の特徴に関連する画像の特徴を捉えることができることを示唆している。
プロジェクトページとコードは以下の通りである。 https://ricklisz.github.io/flexict.github.io and https://github.com/ricklisz/FlexiCT。
関連論文リスト
- OmniCT: Towards a Unified Slice-Volume LVLM for Comprehensive CT Analysis [53.01523944168442]
臨床解釈はスライス駆動の局所特徴と体積駆動の空間表現の両方に依存している。
既存のLVLM(Large Vision-Language Models)は、CTスライスとボリューム理解で断片化されている。
我々は,CTシナリオのための強力な統合スライスボリュームLVLMであるOmniCTを提案する。
論文 参考訳(メタデータ) (2026-02-18T00:42:41Z) - Subcortical Masks Generation in CT Images via Ensemble-Based Cross-Domain Label Transfer [1.312727273368205]
神経画像における皮質下セグメンテーションは、脳解剖の理解と、外傷性脳損傷や神経変性障害のコンピュータ支援による診断の促進に重要な役割を果たしている。
磁気共鳴画像(MRI)用の皮質下セグメンテーションデータセットが公開されているが、CT(Computed Tomography)には大きなギャップがある。
本稿では,既存のMRIモデルを利用して,CTスキャンのための高品質な皮質下セグメンテーションラベルを生成するための自動アンサンブルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-15T12:57:35Z) - Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach [57.86418347491272]
全身に404例の異常所見を呈する包括的階層分類システムを提案する。
複数平面および全人体領域からの14.5K以上のCT画像を含むデータセットを寄贈し,19K以上の異常に対する接地アノテーションを念頭に提供した。
OminiAbnorm-CTは,テキストクエリに基づいて,多面的および全身的なCT画像に異常な所見を自動的に検出し,記述することができる。
論文 参考訳(メタデータ) (2025-06-03T17:57:34Z) - A Continual Learning-driven Model for Accurate and Generalizable Segmentation of Clinically Comprehensive and Fine-grained Whole-body Anatomies in CT [67.34586036959793]
完全に注釈付きCTデータセットは存在せず、すべての解剖学がトレーニングのために記述されている。
完全解剖を分割できる連続学習駆動CTモデルを提案する。
単体CT分割モデルCL-Netは, 臨床的に包括的に包括的に235個の粒状体解剖の集合を高精度に分割することができる。
論文 参考訳(メタデータ) (2025-03-16T23:55:02Z) - Vision Foundation Models for Computed Tomography [0.5320113414681007]
基礎モデル(FM)は、画像のモダリティを越えて多種多様な複雑なタスクを実行することにより、放射線学における変換可能性を示している。
そこで我々はCT-FM(CT-FM)を開発した。
CT-FMは画像データコモンズから148,000個のCTスキャンを用いてラベルに依存しないコントラスト学習によって事前訓練を行った。
論文 参考訳(メタデータ) (2025-01-15T18:30:58Z) - SegBook: A Simple Baseline and Cookbook for Volumetric Medical Image Segmentation [20.026663367994356]
大量のフルボディCT画像は、強力なモデルを事前訓練する機会を提供する。
これらの事前訓練されたモデルが、下流の様々な医療セグメンテーションタスクに移行できる状況は、まだ不明である。
我々は,全体CT事前訓練モデルの転写能力を評価するために,モダリティ,ターゲット,サンプルサイズが異なる87の公開データセットを収集した。
論文 参考訳(メタデータ) (2024-11-21T19:00:01Z) - RadGenome-Chest CT: A Grounded Vision-Language Dataset for Chest CT Analysis [56.57177181778517]
RadGenome-Chest CTはCT-RATEに基づく大規模3次元胸部CT解釈データセットである。
私たちは、最新の強力なユニバーサルセグメンテーションと大きな言語モデルを活用して、元のデータセットを拡張します。
論文 参考訳(メタデータ) (2024-04-25T17:11:37Z) - CT-GLIP: 3D Grounded Language-Image Pretraining with CT Scans and Radiology Reports for Full-Body Scenarios [53.94122089629544]
我々は,CT-GLIP(Grounded Language- Image Pretraining with CT scans)を導入する。
本手法は,104臓器にわたる17,702症例を対象に,44,011例の臓器レベルの視覚テキストペアからなるマルチモーダルCTデータセットを用いて訓練し,自然言語を用いて臓器と異常をゼロショットで識別できることを実証した。
論文 参考訳(メタデータ) (2024-04-23T17:59:01Z) - Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography [21.25960416231541]
我々は3次元医用画像と対応するテキストレポートを組み合わせたデータセットであるCT-RATEを紹介する。
我々はCTに焦点を当てたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。
我々は3次元胸部CTボリュームの視覚言語チャットモデルであるCT-CHATを作成する。
論文 参考訳(メタデータ) (2024-03-26T16:19:56Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Weakly Supervised 3D Classification of Chest CT using Aggregated
Multi-Resolution Deep Segmentation Features [5.938730586521215]
CT画像の病巣分類は, 症例レベルのアノテーションが原因で, 局所性に乏しい。
マルチレゾリューション・セグメンテーション・フィーチャーマップを用いて学習した意味構造概念を活用する医療分類器を提案する。
論文 参考訳(メタデータ) (2020-10-31T00:16:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。