論文の概要: FluenceFormer: Transformer-Driven Multi-Beam Fluence Map Regression for Radiotherapy Planning
- arxiv url: http://arxiv.org/abs/2512.22425v1
- Date: Sat, 27 Dec 2025 01:12:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.046454
- Title: FluenceFormer: Transformer-Driven Multi-Beam Fluence Map Regression for Radiotherapy Planning
- Title(参考訳): FluenceFormer: 放射線治療計画のためのトランスフォーマー駆動マルチビームフルエンスマップ回帰
- Authors: Ujunwa Mgboh, Rafi Ibn Sultan, Joshua Kim, Kundan Thind, Dongxiao Zhu,
- Abstract要約: textbfFluenceFormerは、直接的かつ幾何学的に認識されるフレンス回帰のための、バックボーンに依存しないトランスフォーマーフレームワークである。
Swin UNETRを使用したFluenceFormerは、評価されたモデルの中で最強のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 4.066732323672965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fluence map prediction is central to automated radiotherapy planning but remains an ill-posed inverse problem due to the complex relationship between volumetric anatomy and beam-intensity modulation. Convolutional methods in prior work often struggle to capture long-range dependencies, which can lead to structurally inconsistent or physically unrealizable plans. We introduce \textbf{FluenceFormer}, a backbone-agnostic transformer framework for direct, geometry-aware fluence regression. The model uses a unified two-stage design: Stage~1 predicts a global dose prior from anatomical inputs, and Stage~2 conditions this prior on explicit beam geometry to regress physically calibrated fluence maps. Central to the approach is the \textbf{Fluence-Aware Regression (FAR)} loss, a physics-informed objective that integrates voxel-level fidelity, gradient smoothness, structural consistency, and beam-wise energy conservation. We evaluate the generality of the framework across multiple transformer backbones, including Swin UNETR, UNETR, nnFormer, and MedFormer, using a prostate IMRT dataset. FluenceFormer with Swin UNETR achieves the strongest performance among the evaluated models and improves over existing benchmark CNN and single-stage methods, reducing Energy Error to $\mathbf{4.5\%}$ and yielding statistically significant gains in structural fidelity ($p < 0.05$).
- Abstract(参考訳): フルエンスマップ予測は, 自動放射線治療計画の中心であるが, 容積解剖学とビーム強度変調の複雑な関係から, 不適切な逆問題となっている。
事前の作業における畳み込みの方法は、しばしば長距離依存を捉えるのに苦労し、構造的に矛盾する、または物理的に実現不可能な計画に繋がる。
本稿では, バックボーンに依存しないトランスフォーマーフレームワークである‘textbf{FluenceFormer} を紹介した。
ステージ~1は解剖学的入力から大域的用量を予測し、ステージ~2は、物理的に校正されたフレンスマップを回帰するために、明示的なビーム幾何に先立ってこれを条件付ける。
このアプローチの中心にあるのは、ボクセルレベルの忠実さ、勾配の滑らかさ、構造的一貫性、ビームワイズエネルギーの保存を統合する物理インフォーマルな目的である「textbf{Fluence-Aware Regression (FAR)」の損失である。
我々は、前立腺IMRTデータセットを用いて、Swin UNETR、UNETR、nnFormer、MedFormerを含む複数のトランスフォーマーバックボーンにわたるフレームワークの汎用性を評価する。
Swin UNETRを使用したFluenceFormerは、評価モデルの中で最強のパフォーマンスを達成し、既存のベンチマークCNNとシングルステージメソッドよりも改善し、Energy Errorを$\mathbf{4.5\%}$に削減し、構造的忠実度(p < 0.05$)の統計的に有意な利益を得る。
関連論文リスト
- Simba: Towards High-Fidelity and Geometrically-Consistent Point Cloud Completion via Transformation Diffusion [31.34032485865941]
分散学習問題として,ポイントワイズ変換の回帰を再構成する新しいフレームワークであるSimbaを紹介する。
提案手法は, 対称性の先行と拡散モデルの強力な生成能力を統合し, インスタンス固有の記憶を避ける。
論文 参考訳(メタデータ) (2025-11-20T09:02:42Z) - Cross-Distribution Diffusion Priors-Driven Iterative Reconstruction for Sparse-View CT [19.18392754322368]
Sparse-View CT(SVCT)の再建は、時間分解能を高め、放射線線量を減らすが、その臨床的使用は人工物によって妨げられる。
本稿では,SVCTにおけるOOD問題に対処するクロスディストリビューション拡散優先型反復再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-16T22:35:13Z) - ResPF: Residual Poisson Flow for Efficient and Physically Consistent Sparse-View CT Reconstruction [7.644299873269135]
スパース・ビュー・コンピュート・トモグラフィー(CT)は、放射線線量を減らすための実用的な方法であるが、結果として生じる逆問題により、正確な画像再構成に重大な課題が生じる。
生成モデリングの最近の進歩、特にポアソンフロー生成モデル(PFGM)は、高忠実度画像合成を可能にする。
本稿では, 残余ポアソンフロー(ResPF)生成モデルを提案する。
論文 参考訳(メタデータ) (2025-06-06T01:43:35Z) - Global-to-Local Modeling for Video-based 3D Human Pose and Shape
Estimation [53.04781510348416]
フレーム内精度とフレーム間スムーズさにより,映像に基づく3次元人間のポーズと形状推定を評価する。
エンドツーエンドフレームワークGLoT(Global-to-Local Transformer)における長期的・短期的相関のモデル化を構造的に分離することを提案する。
我々のGLoTは、一般的なベンチマーク(3DPW、MPI-INF-3DHP、Human3.6M)において、最も低いモデルパラメータを持つ従来の最先端の手法を上回る。
論文 参考訳(メタデータ) (2023-03-26T14:57:49Z) - PyMAF-X: Towards Well-aligned Full-body Model Regression from Monocular
Images [60.33197938330409]
PyMAF-Xは、モノクロ画像からパラメトリックフルボディモデルを復元するための回帰ベースのアプローチである。
PyMAFとPyMAF-Xは、メッシュイメージアライメントを効果的に改善し、新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2022-07-13T17:58:33Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Homography Decomposition Networks for Planar Object Tracking [11.558401177707312]
平面オブジェクトトラッキングは、ロボット工学、ビジュアルサーボ、ビジュアルSLAMといったAIアプリケーションにおいて重要な役割を果たす。
本稿では, ホログラフィ変換を2つのグループに分解することで, 条件数を大幅に削減し, 安定化する新しいホモグラフィ分解ネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-15T06:13:32Z) - TFPose: Direct Human Pose Estimation with Transformers [83.03424247905869]
ポーズ推定タスクを変換器で効果的に解くことができるシーケンス予測問題に定式化します。
我々のフレームワークは単純で直接的であり、ヒートマップに基づくポーズ推定の欠点を回避している。
MS-COCOおよびMPIIデータセットの実験は、この手法が回帰ベースのポーズ推定の最先端を大幅に改善できることを示しています。
論文 参考訳(メタデータ) (2021-03-29T04:18:54Z) - FPCR-Net: Feature Pyramidal Correlation and Residual Reconstruction for
Optical Flow Estimation [72.41370576242116]
フレーム対からの光フロー推定のための半教師付き特徴ピラミッド相関・残留再構成ネットワーク(FPCR-Net)を提案する。
ピラミッド相関マッピングと残留再構成の2つの主要なモジュールで構成されている。
実験結果から,提案手法は,平均終点誤差 (AEE) に対して0.80, 1.15, 0.10の改善を達成し,最先端性能を実現していることがわかった。
論文 参考訳(メタデータ) (2020-01-17T07:13:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。