論文の概要: Any2Any 3D Diffusion Models with Knowledge Transfer: A Radiotherapy Planning Study
- arxiv url: http://arxiv.org/abs/2605.09622v1
- Date: Sun, 10 May 2026 16:08:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.337996
- Title: Any2Any 3D Diffusion Models with Knowledge Transfer: A Radiotherapy Planning Study
- Title(参考訳): 知識伝達を伴う任意の3次元拡散モデル:放射線治療計画研究
- Authors: Yuhan Wang, Zihan Li, Han Liu, Simon Arberet, Martin Kraus, Yuyin Zhou, Florin-Cristian Ghesu, Dorin Comaniciu, Ali Kamen, Riqiang Gao,
- Abstract要約: 本稿では,Any2Any3D拡散フレームワークDiffKT3Dを提案する。
我々は,モダリティ特異的な埋め込みを,クロスアテンションのオーバーヘッドなく活用するAny2Any条件付きパラダイムを提案する。
GDP-HMMチャレンジの勝者と比較すると、DiffKT3DはボクセルレベルのMAEを2.07から1.93に減らし、新しい最先端の線量予測を設定できる。
- 参考スコア(独自算出の注目度): 29.611544308331904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Voxel-wise dose prediction is a critical yet challenging task in practical radiotherapy (RT) planning, as bespoke models trained from scratch often struggle to generalize across diverse clinical settings. Meanwhile, generative models trained on billion-scale datasets from vision domains have achieved impressive performance. Herein, we propose DiffKT3D, a unified Any2Any 3D diffusion framework that leverages prior knowledge from pretrained video diffusion models for efficient and clinically meaningful dose prediction. To enable flexible conditioning across multiple clinical modalities (CT, anatomical structures, body, beam settings, etc.), we introduce an Any2Any conditional paradigm utilizing modality-specific embeddings without cross-attention overhead. Further, we design a novel reinforcement learning (RL) post-training mechanism guided by a clinically-informed Scorecard explicitly tailored to institutional treatment preferences. Compared with winner of GDP-HMM challenge, DiffKT3D sets a new state-of-the-art in dose prediction by reducing voxel-level MAE from 2.07 to 1.93. In addition, DiffKT3D achieves superior image quality and preference match. These results demonstrate that transferring diffusion priors via modality-aware conditioning and clinically aligned RL post-training can provide a robust and generalizable solution for RT planning across various clinical scenarios.
- Abstract(参考訳): ボクセル単位の線量予測は実用的な放射線治療(RT)計画において重要な課題である。
一方、視覚領域から数十億のデータセットでトレーニングされた生成モデルは、素晴らしいパフォーマンスを達成している。
本稿では、事前学習したビデオ拡散モデルからの事前知識を有効かつ臨床的に有意な線量予測に活用する統合型Any2Any 3D拡散フレームワークDiffKT3Dを提案する。
複数の臨床的モダリティ(CT,解剖学的構造,体,ビーム設定など)をまたいだフレキシブルなコンディショニングを実現するために,横断的オーバーヘッドを伴わずにモダリティ特異的な埋め込みを利用するAny2Anyコンディショニングパラダイムを導入する。
さらに,臨床的にインフォームドされたScorecardで指導される新たな強化学習(RL)機構を,制度的治療の嗜好に合わせて設計する。
GDP-HMMチャレンジの勝者と比較すると、DiffKT3DはボクセルレベルのMAEを2.07から1.93に減らし、新しい最先端の線量予測を設定できる。
さらに、DiffKT3Dは画質と好みのマッチングが優れている。
これらの結果から, RTプランニングにおいて, モダリティ対応条件と臨床適応RLポストトレーニングによる拡散先行の伝達が, 様々な臨床シナリオにおいて堅牢かつ一般化可能な解決策となることが示唆された。
関連論文リスト
- MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - Optimizing 3D Diffusion Models for Medical Imaging via Multi-Scale Reward Learning [7.493047521402676]
本稿では,RL(Reinforcement Learning)を用いた3次元拡散モデルの改良手法を提案する。
2次元スライス・アセスメントと3次元解析を統合した新たな報酬システムによって導かれるPPO(Proximal Policy Optimization)を用いてモデルを微調整する。
以上の結果から,RLフィードバックを組み込むことで,より高品質な分散を実現することが可能であることが示唆された。
論文 参考訳(メタデータ) (2026-03-06T11:30:55Z) - Med3D-R1: Incentivizing Clinical Reasoning in 3D Medical Vision-Language Models for Abnormality Diagnosis [20.302134776419955]
我々は,2段階の学習プロセスを持つ強化学習フレームワークを提案する: 教師付きファインチューニング(SFT)と強化学習(RL)。
RLの段階では、整合性報酬を再定義し、整合性、ステップバイステップの診断推論を明示的に促進する。
本モデルではCT-RATEでは41.92%,RAD-ChestCTでは44.99%の精度が得られた。
論文 参考訳(メタデータ) (2026-02-01T12:43:11Z) - MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - FoundDiff: Foundational Diffusion Model for Generalizable Low-Dose CT Denoising [55.04342933312839]
本稿では,CT(低線量CT)デノナイズのための基礎拡散モデルFoundDiffを提案する。
FoundDiffは、(i)線量解剖学的知覚と(ii)適応的認知という2段階の戦略を採用している。
まず, 線量および解剖学的知覚を実現するために, 線量および解剖学的対応型コントラスト言語画像事前訓練モデル(DA-CLIP)を開発した。
第2に,適応的および一般化可能な復調を行うために,線量および解剖学的拡散モデル(DA-Diff)を設計する。
論文 参考訳(メタデータ) (2025-08-24T11:03:56Z) - Conditional Diffusion Model with Anatomical-Dose Dual Constraints for End-to-End Multi-Tumor Dose Prediction [13.716930604289924]
ADDiff-Doseは、エンドツーエンドの多腫瘍量予測のための解剖学的二重制約拡散モデルである。
マルチヘッドアテンション機構を介して条件特徴を組み込み、MSE、条件項、KLの発散を組み合わせた複合損失関数を利用する。
従来のベースラインよりも大幅に優れており、MAEは0.101-0.154、DICE係数は0.927、脊髄最大線量誤差は0.1Gyに制限されている。
論文 参考訳(メタデータ) (2025-08-04T04:25:47Z) - Benchmarking Foundation Models and Parameter-Efficient Fine-Tuning for Prognosis Prediction in Medical Imaging [40.35825564674249]
本研究では,基礎モデルにおける伝達学習戦略の堅牢性と効率性を評価するための最初の構造化されたベンチマークを紹介する。
新型コロナウイルス(COVID-19)の胸部X線データセットが4つ使用されており、死亡率、重症度、入院率をカバーしている。
一般またはバイオメディカルデータセットで事前訓練されたImageNetとFMで事前訓練されたCNNは、完全な微調整、線形探索、パラメータ効率のよい手法を用いて適応された。
論文 参考訳(メタデータ) (2025-06-23T09:16:04Z) - A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本稿では,2次元監視のみを用いた3次元画像調和拡散モデルの学習フレームワークを提案する。
既存の3D生成モデルは、大規模な3Dデータセットが不足しているため、完全に3Dの監視に依存している。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - Abnormality-Driven Representation Learning for Radiology Imaging [0.8321462983924758]
病変強調型コントラスト学習(LeCL)は,CTスキャンの異なる部位にわたる2次元軸方向スライスにおける異常により引き起こされる視覚的表現を得るための新しい手法である。
本研究は, 腫瘍病変位置, 肺疾患検出, 患者ステージングの3つの臨床的課題に対するアプローチを, 最先端の4つの基礎モデルと比較した。
論文 参考訳(メタデータ) (2024-11-25T13:53:26Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Ensemble Transfer Learning for the Prediction of Anti-Cancer Drug
Response [49.86828302591469]
本稿では,抗がん剤感受性の予測にトランスファーラーニングを適用した。
我々は、ソースデータセット上で予測モデルをトレーニングし、ターゲットデータセット上でそれを洗練する古典的な転送学習フレームワークを適用した。
アンサンブル転送学習パイプラインは、LightGBMと異なるアーキテクチャを持つ2つのディープニューラルネットワーク(DNN)モデルを使用して実装されている。
論文 参考訳(メタデータ) (2020-05-13T20:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。