論文の概要: A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation
- arxiv url: http://arxiv.org/abs/2502.06171v1
- Date: Mon, 10 Feb 2025 05:45:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:30:03.936709
- Title: A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation
- Title(参考訳): オンコロジーCT解釈のためのデータ効率の良いパン・トゥルム基礎モデル
- Authors: Wenhui Lei, Hanyu Chen, Zitian Zhang, Luyang Luo, Qiong Xiao, Yannian Gu, Peng Gao, Yankai Jiang, Ci Wang, Guangtao Wu, Tongjia Xu, Yingjie Zhang, Xiaofan Zhang, Pranav Rajpurkar, Shaoting Zhang, Zhenning Wang,
- Abstract要約: PASTAは、46の腫瘍学タスクのうち45の最先端のパフォーマンスを達成するパン腫瘍CT基盤モデルである。
PASTA-Genは、ピクセルレベルのアノテート病変とペア構造レポートを備えた3万個のCTスキャンの包括的なデータセットを生成する。
- 参考スコア(独自算出の注目度): 17.993838581176902
- License:
- Abstract: Artificial intelligence-assisted imaging analysis has made substantial strides in tumor diagnosis and management. Here we present PASTA, a pan-tumor CT foundation model that achieves state-of-the-art performance on 45 of 46 representative oncology tasks -- including lesion segmentation, tumor detection in plain CT, tumor staging, survival prediction, structured report generation, and cross-modality transfer learning, significantly outperforming the second-best models on 35 tasks. This remarkable advancement is driven by our development of PASTA-Gen, an innovative synthetic tumor generation framework that produces a comprehensive dataset of 30,000 CT scans with pixel-level annotated lesions and paired structured reports, encompassing malignancies across ten organs and five benign lesion types. By leveraging this rich, high-quality synthetic data, we overcome a longstanding bottleneck in the development of CT foundation models -- specifically, the scarcity of publicly available, high-quality annotated datasets due to privacy constraints and the substantial labor required for scaling precise data annotation. Encouragingly, PASTA demonstrates exceptional data efficiency with promising practical value, markedly improving performance on various tasks with only a small amount of real-world data. The open release of both the synthetic dataset and PASTA foundation model effectively addresses the challenge of data scarcity, thereby advancing oncological research and clinical translation.
- Abstract(参考訳): 人工知能による画像解析は、腫瘍の診断と管理に大きく貢献している。
今回提案するパン・腫瘍CT基盤モデル(PASTA)は, 病変の分節, 腫瘍検出, 腫瘍のステージング, 生存予測, 構造化レポート生成, 異物間移動学習など, 46の腫瘍学タスクのうち45の最先端を達成し, 35のタスクにおいて第2のベテランモデルを著しく上回っている。
PASTA-Genは,10の臓器と5種類の良性病変を含む,ピクセルレベルのアノテート病変と2つの構造的報告を含む3万個のCTスキャンの包括的データセットを生成する,革新的な合成腫瘍生成フレームワークである。
このリッチで高品質な合成データを活用することで、CTファンデーションモデルの開発における長年のボトルネックを克服します。
PASTAは有望な実用価値を持つ例外的なデータ効率を示し、少数の実世界のデータだけで様々なタスクのパフォーマンスを著しく向上させる。
人工データセットとPASTAファンデーションモデルのオープンリリースは、データ不足の課題に効果的に対処し、オンコロジー研究と臨床翻訳を促進する。
関連論文リスト
- ScaleMAI: Accelerating the Development of Trusted Datasets and AI Models [46.80682547774335]
我々はAI統合データキュレーションとアノテーションのエージェントであるScaleMAIを提案する。
まず、ScaleMAIは25,362個のCTスキャンを作成した。
第2に、プログレッシブなヒューマン・イン・ザ・ループのイテレーションを通じて、ScaleMAIはFragship AI Modelを提供する。
論文 参考訳(メタデータ) (2025-01-06T22:12:00Z) - ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation [3.8763197858217935]
ONCOPILOTは、全身を覆う約7,500個のCTスキャンに基づいて訓練された、インタラクティブな放射線基礎モデルである。
ポイントクリックやバウンディングボックスのような視覚的なプロンプトを使って3D腫瘍のセグメンテーションを行い、最先端のモデルより優れています。
ONCOPILOTは測定プロセスを加速し、リーダー間のばらつきを低減する。
論文 参考訳(メタデータ) (2024-10-10T13:36:49Z) - 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。
パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-09-28T12:31:07Z) - AutoPET Challenge: Tumour Synthesis for Data Augmentation [26.236831356731017]
我々は,CT画像のためのDiffTumor法を適用し,病変のあるPET-CT画像を生成する。
提案手法では,AutoPETデータセット上で生成モデルをトレーニングし,トレーニングデータの拡張に使用する。
以上の結果から,拡張データセットでトレーニングしたモデルでは,Diceスコアが向上し,データ拡張アプローチの可能性が示された。
論文 参考訳(メタデータ) (2024-09-12T14:23:19Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - Cell Maps Representation For Lung Adenocarcinoma Growth Patterns Classification In Whole Slide Images [0.5906576076342179]
肺腺癌は, 形態学的に異質な疾患であり, 5つの原発組織学的成長パターンを特徴とする。
組織タイルを5つのパターンの1つまたは非腫瘍の1つに分類できる新しい機械学習パイプラインを提案する。
論文 参考訳(メタデータ) (2023-11-27T14:12:51Z) - 3DGAUnet: 3D generative adversarial networks with a 3D U-Net based
generator to achieve the accurate and effective synthesis of clinical tumor
image data for pancreatic cancer [6.821916296001028]
PDAC腫瘍と膵組織の3DCT画像を生成する3DGAUnetという3DGAUnetモデルを開発した。
我々の革新は、PDAC腫瘍や膵組織の形状とテクスチャ学習を改善するために、ジェネレータのための3次元U-Netアーキテクチャを開発することである。
論文 参考訳(メタデータ) (2023-11-09T19:10:28Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。