論文の概要: A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation
- arxiv url: http://arxiv.org/abs/2502.06171v1
- Date: Mon, 10 Feb 2025 05:45:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 18:57:50.846087
- Title: A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation
- Title(参考訳): オンコロジーCT解釈のためのデータ効率の良いパン・トゥルム基礎モデル
- Authors: Wenhui Lei, Hanyu Chen, Zitian Zhang, Luyang Luo, Qiong Xiao, Yannian Gu, Peng Gao, Yankai Jiang, Ci Wang, Guangtao Wu, Tongjia Xu, Yingjie Zhang, Xiaofan Zhang, Pranav Rajpurkar, Shaoting Zhang, Zhenning Wang,
- Abstract要約: PASTAは、46の腫瘍学タスクのうち45の最先端のパフォーマンスを達成するパン腫瘍CT基盤モデルである。
PASTA-Genは、ピクセルレベルのアノテート病変とペア構造レポートを備えた3万個のCTスキャンの包括的なデータセットを生成する。
- 参考スコア(独自算出の注目度): 17.993838581176902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence-assisted imaging analysis has made substantial strides in tumor diagnosis and management. Here we present PASTA, a pan-tumor CT foundation model that achieves state-of-the-art performance on 45 of 46 representative oncology tasks -- including lesion segmentation, tumor detection in plain CT, tumor staging, survival prediction, structured report generation, and cross-modality transfer learning, significantly outperforming the second-best models on 35 tasks. This remarkable advancement is driven by our development of PASTA-Gen, an innovative synthetic tumor generation framework that produces a comprehensive dataset of 30,000 CT scans with pixel-level annotated lesions and paired structured reports, encompassing malignancies across ten organs and five benign lesion types. By leveraging this rich, high-quality synthetic data, we overcome a longstanding bottleneck in the development of CT foundation models -- specifically, the scarcity of publicly available, high-quality annotated datasets due to privacy constraints and the substantial labor required for scaling precise data annotation. Encouragingly, PASTA demonstrates exceptional data efficiency with promising practical value, markedly improving performance on various tasks with only a small amount of real-world data. The open release of both the synthetic dataset and PASTA foundation model effectively addresses the challenge of data scarcity, thereby advancing oncological research and clinical translation.
- Abstract(参考訳): 人工知能による画像解析は、腫瘍の診断と管理に大きく貢献している。
今回提案するパン・腫瘍CT基盤モデル(PASTA)は, 病変の分節, 腫瘍検出, 腫瘍のステージング, 生存予測, 構造化レポート生成, 異物間移動学習など, 46の腫瘍学タスクのうち45の最先端を達成し, 35のタスクにおいて第2のベテランモデルを著しく上回っている。
PASTA-Genは,10の臓器と5種類の良性病変を含む,ピクセルレベルのアノテート病変と2つの構造的報告を含む3万個のCTスキャンの包括的データセットを生成する,革新的な合成腫瘍生成フレームワークである。
このリッチで高品質な合成データを活用することで、CTファンデーションモデルの開発における長年のボトルネックを克服します。
PASTAは有望な実用価値を持つ例外的なデータ効率を示し、少数の実世界のデータだけで様々なタスクのパフォーマンスを著しく向上させる。
人工データセットとPASTAファンデーションモデルのオープンリリースは、データ不足の課題に効果的に対処し、オンコロジー研究と臨床翻訳を促進する。
関連論文リスト
- LymphAtlas- A Unified Multimodal Lymphoma Imaging Repository Delivering AI-Enhanced Diagnostic Insight [3.746123328463508]
本研究はPET代謝情報をCT解剖学的構造と統合し,PET/CT検査に基づく悪性リンパ腫の3次元マルチモーダルセグメンテーションデータセットを構築した。
2011年3月から2024年5月までの間に得られた483件の検査データセットを, 220件の患者を対象に遡及的に収集した。
論文 参考訳(メタデータ) (2025-04-29T06:10:12Z) - FundusGAN: A Hierarchical Feature-Aware Generative Framework for High-Fidelity Fundus Image Generation [35.46876389599076]
FundusGANは、高忠実度ファンドス画像合成用に特別に設計された新しい階層的特徴認識生成フレームワークである。
我々は、FundusGANが複数のメトリクスにわたって最先端のメソッドを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-03-22T18:08:07Z) - ScaleMAI: Accelerating the Development of Trusted Datasets and AI Models [46.80682547774335]
我々はAI統合データキュレーションとアノテーションのエージェントであるScaleMAIを提案する。
まず、ScaleMAIは25,362個のCTスキャンを作成した。
第2に、プログレッシブなヒューマン・イン・ザ・ループのイテレーションを通じて、ScaleMAIはFragship AI Modelを提供する。
論文 参考訳(メタデータ) (2025-01-06T22:12:00Z) - ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation [3.8763197858217935]
ONCOPILOTは、全身を覆う約7,500個のCTスキャンに基づいて訓練された、インタラクティブな放射線基礎モデルである。
ポイントクリックやバウンディングボックスのような視覚的なプロンプトを使って3D腫瘍のセグメンテーションを行い、最先端のモデルより優れています。
ONCOPILOTは測定プロセスを加速し、リーダー間のばらつきを低減する。
論文 参考訳(メタデータ) (2024-10-10T13:36:49Z) - 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。
パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-09-28T12:31:07Z) - AutoPET Challenge: Tumour Synthesis for Data Augmentation [26.236831356731017]
我々は,CT画像のためのDiffTumor法を適用し,病変のあるPET-CT画像を生成する。
提案手法では,AutoPETデータセット上で生成モデルをトレーニングし,トレーニングデータの拡張に使用する。
以上の結果から,拡張データセットでトレーニングしたモデルでは,Diceスコアが向上し,データ拡張アプローチの可能性が示された。
論文 参考訳(メタデータ) (2024-09-12T14:23:19Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - Beyond Images: An Integrative Multi-modal Approach to Chest X-Ray Report
Generation [47.250147322130545]
画像からテキストまでの放射線学レポート生成は,医療画像の発見を記述した放射線学レポートを自動生成することを目的としている。
既存の方法の多くは画像データのみに焦点をあてており、他の患者情報は放射線科医に公開されていない。
胸部X線レポートを生成するための多モードディープニューラルネットワークフレームワークを,非構造的臨床ノートとともにバイタルサインや症状などの構造化された患者データを統合することで提案する。
論文 参考訳(メタデータ) (2023-11-18T14:37:53Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。