論文の概要: Patient-specific vs Multi-Patient Vision Transformer for Markerless Tumor Motion Forecasting
- arxiv url: http://arxiv.org/abs/2507.07811v1
- Date: Thu, 10 Jul 2025 14:40:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.447093
- Title: Patient-specific vs Multi-Patient Vision Transformer for Markerless Tumor Motion Forecasting
- Title(参考訳): マーカーレス腫瘍運動予測のための患者固有のマルチパタント・ビジョン・トランス
- Authors: Gauthier Rotsart de Hertaing, Dani Manjah, Benoit Macq,
- Abstract要約: 本研究では視覚変換器(ViT)を用いた肺腫瘍運動のマーカーレス予測手法を提案する。
個別化動作パターンを学習する患者特異的(PS)アプローチと、一般化のために設計された多患者(MP)モデルである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: Accurate forecasting of lung tumor motion is essential for precise dose delivery in proton therapy. While current markerless methods mostly rely on deep learning, transformer-based architectures remain unexplored in this domain, despite their proven performance in trajectory forecasting. Purpose: This work introduces a markerless forecasting approach for lung tumor motion using Vision Transformers (ViT). Two training strategies are evaluated under clinically realistic constraints: a patient-specific (PS) approach that learns individualized motion patterns, and a multi-patient (MP) model designed for generalization. The comparison explicitly accounts for the limited number of images that can be generated between planning and treatment sessions. Methods: Digitally reconstructed radiographs (DRRs) derived from planning 4DCT scans of 31 patients were used to train the MP model; a 32nd patient was held out for evaluation. PS models were trained using only the target patient's planning data. Both models used 16 DRRs per input and predicted tumor motion over a 1-second horizon. Performance was assessed using Average Displacement Error (ADE) and Final Displacement Error (FDE), on both planning (T1) and treatment (T2) data. Results: On T1 data, PS models outperformed MP models across all training set sizes, especially with larger datasets (up to 25,000 DRRs, p < 0.05). However, MP models demonstrated stronger robustness to inter-fractional anatomical variability and achieved comparable performance on T2 data without retraining. Conclusions: This is the first study to apply ViT architectures to markerless tumor motion forecasting. While PS models achieve higher precision, MP models offer robust out-of-the-box performance, well-suited for time-constrained clinical settings.
- Abstract(参考訳): 背景: 肺腫瘍運動の正確な予測は, プロトン療法における正確な線量測定に不可欠である。
現在のマーカーレスの手法は主にディープラーニングに依存しているが、トランスフォーマーベースのアーキテクチャはこの領域では探索されていない。
目的:本研究は,視覚変換器(ViT)を用いた肺腫瘍運動のマーカーレス予測手法を導入する。
個別化動作パターンを学習する患者特異的(PS)アプローチと、一般化のために設計された多患者(MP)モデルである。
この比較は、計画と治療セッションの間に生成される画像の限られた数を明示的に説明している。
方法:31例の4DCTスキャンから得られたデジタル再構成X線写真(DRR)を用いてMPモデルを訓練し,32例を評価対象とした。
対象患者の計画データのみを用いてPSモデルを訓練した。
どちらのモデルも入力あたり16DRRを使用し、1秒の水平線上での腫瘍の動きを予測した。
平均変位誤差 (ADE) と最終変位誤差 (FDE) を用いて, 計画(T1) と治療(T2) の両方のデータを用いて評価した。
結果: T1データでは、PSモデルはトレーニングセットのサイズ、特により大きなデータセット(最大25,000DRR、p < 0.05)でMPモデルよりも優れていた。
しかし,MPモデルは屈折解剖学的変動に対して強い強靭性を示し,再トレーニングなしでT2データに匹敵する性能を示した。
結論: マーカーレス腫瘍運動予測にViTアーキテクチャを適用した最初の研究である。
PSモデルは高い精度を達成するが、MPモデルは、時間制約のある臨床環境に適した堅牢なアウト・オブ・ボックス性能を提供する。
関連論文リスト
- PaPaGei: Open Foundation Models for Optical Physiological Signals [8.78925327256804]
光胸腺撮影は生体信号と心臓血管の健康をモニタリングする主要な非侵襲的手法である。
PPG信号に基づいて訓練された機械学習モデルは、タスク固有であり、一般化に苦慮する傾向がある。
PPG信号のための最初のオープン基盤モデルPaPaGeiを提案する。
論文 参考訳(メタデータ) (2024-10-27T18:18:06Z) - Phikon-v2, A large and public feature extractor for biomarker prediction [42.52549987351643]
我々は、DINOv2を用いて視覚変換器を訓練し、このモデルの1つのイテレーションを公開して、Phikon-v2と呼ばれるさらなる実験を行う。
Phikon-v2は、公開されている組織学のスライドをトレーニングしながら、以前リリースしたモデル(Phikon)を上回り、プロプライエタリなデータでトレーニングされた他の病理学基盤モデル(FM)と同等に動作します。
論文 参考訳(メタデータ) (2024-09-13T20:12:29Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - MPRE: Multi-perspective Patient Representation Extractor for Disease
Prediction [3.914545513460964]
疾患予測のための多視点患者表現エクストラクタ(MPRE)を提案する。
具体的には、動的特徴の傾向と変動情報を抽出する周波数変換モジュール(FTM)を提案する。
2D Multi-Extraction Network (2D MEN) において、傾向と変動に基づいて2次元時間テンソルを形成する。
また,FODAM(First-Order difference Attention Mechanism)も提案する。
論文 参考訳(メタデータ) (2024-01-01T13:52:05Z) - Domain Transfer Through Image-to-Image Translation for Uncertainty-Aware Prostate Cancer Classification [42.75911994044675]
前立腺MRIの非対位画像翻訳のための新しいアプローチと臨床的に重要なPCaを分類するための不確実性認識トレーニングアプローチを提案する。
提案手法では,無ペアの3.0T多パラメータ前立腺MRIを1.5Tに翻訳し,利用可能なトレーニングデータを増強する。
実験の結果,提案手法は,従来の研究に比べてAUC(Area Under ROC Curve)を20%以上改善することがわかった。
論文 参考訳(メタデータ) (2023-07-02T05:26:54Z) - Med-Tuning: A New Parameter-Efficient Tuning Framework for Medical Volumetric Segmentation [37.42382366505377]
我々は,医療用ボリュームセグメンテーションタスクのためのパラメータ効率チューニング(PET)を実現するために,Med-Tuningという新しいフレームワークを導入した。
本フレームワークは,自然画像上で事前学習したセグメンテーション作業における2次元ベースラインの精度を向上させる。
完全なFTと比較して、Med-Tuningは細調整されたモデルのパラメータを最大4倍に減らし、セグメンテーション性能も向上した。
論文 参考訳(メタデータ) (2023-04-21T10:47:13Z) - Validated respiratory drug deposition predictions from 2D and 3D medical
images with statistical shape models and convolutional neural networks [47.187609203210705]
患者固有の沈着モデリングのための自動計算フレームワークを開発し,検証することを目的としている。
2次元胸部X線と3次元CT画像から3次元患者の呼吸動態を生成できる画像処理手法が提案されている。
論文 参考訳(メタデータ) (2023-03-02T07:47:07Z) - TMSS: An End-to-End Transformer-based Multimodal Network for
Segmentation and Survival Prediction [0.0]
腫瘍学者は、分析においてこれを行うのではなく、医療画像や患者の歴史などの複数のソースから、脳内の情報を融合させる。
本研究は,がんの定量化と患者の生存率推定において,腫瘍学者の分析行動を模倣する深層学習手法を提案する。
論文 参考訳(メタデータ) (2022-09-12T06:22:05Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Segmentation by Test-Time Optimization (TTO) for CBCT-based Adaptive
Radiation Therapy [2.5705729402510338]
従来型または深層学習(DL)に基づく変形可能な画像登録(DIR)は、多くの状況において改善された結果が得られる。
本稿では,事前学習したDLベースのDIR集団モデルを洗練するためのテスト時間最適化(TTO)手法を提案する。
提案手法は,一般化可能性問題の影響を受けにくく,DLベースのDIRモデルの全体的な性能を向上させることができる。
論文 参考訳(メタデータ) (2022-02-08T16:34:22Z) - Appearance Learning for Image-based Motion Estimation in Tomography [60.980769164955454]
トモグラフィー画像では、取得した信号に擬似逆フォワードモデルを適用することにより、解剖学的構造を再構成する。
患者の動きは、復元過程における幾何学的アライメントを損なうため、運動アーティファクトが生じる。
本研究では,スキャン対象から独立して剛性運動の構造を認識する外観学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-18T09:49:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。