論文の概要: RoMedFormer: A Rotary-Embedding Transformer Foundation Model for 3D Genito-Pelvic Structure Segmentation in MRI and CT
- arxiv url: http://arxiv.org/abs/2503.14304v1
- Date: Tue, 18 Mar 2025 14:45:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:14:40.242363
- Title: RoMedFormer: A Rotary-Embedding Transformer Foundation Model for 3D Genito-Pelvic Structure Segmentation in MRI and CT
- Title(参考訳): RoMedFormer:MRIとCTにおける3次元ジェニート・ペルビック構造分割のためのロータリー埋め込みトランスフォーマーモデル
- Authors: Yuheng Li, Mingzhe Hu, Richard L. J. Qiu, Maria Thor, Andre Williams, Deborah Marshall, Xiaofeng Yang,
- Abstract要約: 放射線治療,外科的計画,疾患診断などの応用には,MRIおよびCTにおけるゲニト骨構造の深層学習に基づくセグメンテーションが不可欠である。
我々は,MRIとCTの両方において3次元女性性骨盤構造セグメンテーションのための回転埋め込みトランスフォーメーションモデルであるRoMedFormerを提案する。
- 参考スコア(独自算出の注目度): 4.76971404389011
- License:
- Abstract: Deep learning-based segmentation of genito-pelvic structures in MRI and CT is crucial for applications such as radiation therapy, surgical planning, and disease diagnosis. However, existing segmentation models often struggle with generalizability across imaging modalities, and anatomical variations. In this work, we propose RoMedFormer, a rotary-embedding transformer-based foundation model designed for 3D female genito-pelvic structure segmentation in both MRI and CT. RoMedFormer leverages self-supervised learning and rotary positional embeddings to enhance spatial feature representation and capture long-range dependencies in 3D medical data. We pre-train our model using a diverse dataset of 3D MRI and CT scans and fine-tune it for downstream segmentation tasks. Experimental results demonstrate that RoMedFormer achieves superior performance segmenting genito-pelvic organs. Our findings highlight the potential of transformer-based architectures in medical image segmentation and pave the way for more transferable segmentation frameworks.
- Abstract(参考訳): 放射線治療,外科的計画,疾患診断などの応用には,MRIおよびCTにおけるゲニト骨構造の深層学習に基づくセグメンテーションが不可欠である。
しかし、既存のセグメンテーションモデルは、画像のモダリティや解剖学的なバリエーションにまたがる一般化性に苦慮することが多い。
本研究では,MRIおよびCTにおける3次元女性性骨盤構造のセグメンテーションのための回転埋め込み型トランスフォーメーションモデルであるRoMedFormerを提案する。
RoMedFormerは、自己教師付き学習と回転位置埋め込みを活用して、空間的特徴表現を強化し、3D医療データにおける長距離依存関係をキャプチャする。
我々は3次元MRIとCTスキャンの多様なデータセットを用いてモデルを事前訓練し、下流のセグメンテーションタスクのために微調整する。
実験結果から,RoMedFormerは生殖骨盤内臓器のセグメンテーションに優れていた。
本研究は, 医用画像分割におけるトランスフォーマーアーキテクチャの可能性を強調し, より伝達可能なセグメンテーションフレームワークの道を開くものである。
関連論文リスト
- Is Long Range Sequential Modeling Necessary For Colorectal Tumor Segmentation? [3.4031606383293154]
TransformersやMambaのような長距離ボリュームシーケンスモデリング機構は、3次元画像分割において高い精度を実現する能力に注目を集めている。
我々は,これらのグローバルトークンモデリング手法の有効性を,提案したMambaOutUNetに比較して評価した。
本研究は,ロバストな局所トークン相互作用が,関心領域が小さく,解剖学的に複雑である場合に,長距離モデリング技術より優れていることを示唆する。
論文 参考訳(メタデータ) (2025-02-10T23:24:01Z) - Vision Foundation Models for Computed Tomography [0.5320113414681007]
基礎モデル(FM)は、画像のモダリティを越えて多種多様な複雑なタスクを実行することにより、放射線学における変換可能性を示している。
そこで我々はCT-FM(CT-FM)を開発した。
CT-FMは画像データコモンズから148,000個のCTスキャンを用いてラベルに依存しないコントラスト学習によって事前訓練を行った。
論文 参考訳(メタデータ) (2025-01-15T18:30:58Z) - 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。
パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-09-28T12:31:07Z) - ShapeMamba-EM: Fine-Tuning Foundation Model with Local Shape Descriptors and Mamba Blocks for 3D EM Image Segmentation [49.42525661521625]
本稿では3次元EMセグメンテーションのための特殊微調整法であるShapeMamba-EMを提案する。
5つのセグメンテーションタスクと10のデータセットをカバーする、幅広いEMイメージでテストされている。
論文 参考訳(メタデータ) (2024-08-26T08:59:22Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - 3D Brainformer: 3D Fusion Transformer for Brain Tumor Segmentation [6.127298607534532]
深層学習は、最近脳腫瘍のセグメンテーションを改善するために現れた。
変換器は畳み込みネットワークの限界に対処するために利用されてきた。
本稿では,3次元トランスフォーマーを用いたセグメンテーション手法を提案する。
論文 参考訳(メタデータ) (2023-04-28T02:11:29Z) - Multiscale Metamorphic VAE for 3D Brain MRI Synthesis [5.060516201839319]
3次元脳MRIの創発的モデリングは、データ分布の十分なカバレッジを確保しつつ、高い視覚的忠実度を達成することの難しさを示す。
本研究では, この課題に対して, 可変オートエンコーダフレームワークにおける構成可能なマルチスケール形態素変換を用いて対処することを提案する。
VAEやGAN(Generative Adversarial Network)をベースとした先行作業と比較して,FIDの性能は,同等あるいは優れた再現品質を維持しつつ,大幅に向上した。
論文 参考訳(メタデータ) (2023-01-09T09:15:30Z) - Context-Aware Transformers For Spinal Cancer Detection and Radiological
Grading [70.04389979779195]
本稿では,脊椎分析に関わる医療画像問題に対するトランスフォーマーを用いた新しいモデルアーキテクチャを提案する。
MR画像におけるそのようなモデルの2つの応用について考察する: (a)脊椎転移の検出と脊椎骨折の関連状況と転移性脊髄圧迫。
画像中の脊椎のコンテキストを考慮することで,SCTは以前に公表したモデルと比較して,いくつかのグレーディングの精度を向上することを示す。
論文 参考訳(メタデータ) (2022-06-27T10:31:03Z) - A unified 3D framework for Organs at Risk Localization and Segmentation
for Radiation Therapy Planning [56.52933974838905]
現在の医療ワークフローは、OAR(Organs-at-risk)のマニュアル記述を必要とする
本研究は,OARローカライゼーション・セグメンテーションのための統合された3Dパイプラインの導入を目的とする。
提案手法は医用画像に固有の3Dコンテキスト情報の活用を可能にする。
論文 参考訳(メタデータ) (2022-03-01T17:08:41Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。