論文の概要: 3D MRI Image Pretraining via Controllable 2D Slice Navigation Task
- arxiv url: http://arxiv.org/abs/2605.06487v1
- Date: Thu, 07 May 2026 16:08:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.980097
- Title: 3D MRI Image Pretraining via Controllable 2D Slice Navigation Task
- Title(参考訳): 制御可能な2次元スライスナビゲーションタスクによる3次元MRI画像の事前学習
- Authors: Yu Wang, Qingchao Chen,
- Abstract要約: 自己教師付きプレトレーニングは、ラベルなしスキャンからMRI表現を学ぶための主流のアプローチとなっている。
マスクしたパッチの再構築と異なる、固有の自己超越信号が存在するかどうかを問う。
スライスを連続的な位置、向き、スケールでレンダリングすることで、3Dボリュームを高密度なビデオアクションシーケンスに変換することができる。
- 参考スコア(独自算出の注目度): 21.334351019760252
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Self-supervised pretraining has become the mainstream approach for learning MRI representations from unlabeled scans. However, most existing objectives still treat each scan primarily as static aggregations of slices, patches or volumes. We ask whether there exists an intrinsic form of self-supervision signal that is different from reconstructing the masked patches, through transforming the 3D volumes into controllable 2D rendered sequences: by rendering slices at continuous positions, orientations, and scales, a 3D volume can be converted into dense video-action sequences whose controls are the action trajectories. We study this formulation with an action-conditioned pretraining objective, where a tokenizer encodes slice observations and a latent dynamics model predicts the evolution of latent features. Across representative anatomical and spatial downstream tasks, the proposed pretraining is evaluated against standard static-volume baselines, tokenizer-only pretraining, and dynamics variants without aligned actions. These results suggest that controllable MRI slice navigation provides a useful complementary pretraining interface for learning anatomical and spatial representations from large unlabeled MRI collections.
- Abstract(参考訳): 自己教師付きプレトレーニングは、ラベルなしスキャンからMRI表現を学ぶための主流のアプローチとなっている。
しかし、既存のほとんどの目的はスキャンをスライス、パッチ、ボリュームの静的アグリゲーションとして扱う。
我々は、3Dボリュームを制御可能な2Dレンダリングシーケンスに変換することで、3Dボリュームを連続的な位置、向き、スケールでレンダリングすることで、3Dボリュームをアクショントラジェクトリを制御した高密度なビデオアクションシーケンスに変換することができるという、マスク付きパッチの再構築とは異なる、固有の自己スーパービジョン信号が存在するかどうかを問う。
我々は,この定式化を行動条件付き事前学習目標を用いて研究し,トークン化器がスライス観測を符号化し,潜時ダイナミクスモデルが潜時特徴の進化を予測する。
従来の静的ボリュームベースライン, トークンマイザのみの事前学習, 動的変動に対して, 協調動作を伴わない, 動的変動に対して, 提案した事前学習を, 解剖学的および空間的下流タスク全体で評価した。
以上の結果から,制御可能なMRIスライスナビゲーションは,大規模なMRIコレクションから解剖学的および空間的表現を学習するための補助的事前訓練インタフェースとして有用であることが示唆された。
関連論文リスト
- MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - Extending 2D foundational DINOv3 representations to 3D segmentation of neonatal brain MR images [3.186130813218338]
グローバルMRIボリュームは、重複しない3Dウィンドウまたはサブキューブに分解され、それぞれが凍結した高忠実度機能の上に構築された別個のデコードアームを介して処理される。
提案手法は、1つの3Dウィンドウに対してDiceスコア0.65を達成する。
論文 参考訳(メタデータ) (2026-02-27T12:16:21Z) - Training-Free Zero-Shot Anomaly Detection in 3D Brain MRI with 2D Foundation Models [0.0]
3次元脳MRIにおけるZSADのためのフルトレーニングフリーフレームワークについて紹介する。
このフレームワークは, 2次元基礎モデルにより処理された多軸スライスを集約することにより, 局所化ボリュームトークンを構成する。
これらの3Dパッチトークンは、立方体空間コンテキストを復元し、距離ベースでバッチレベルの異常検出パイプラインと直接統合する。
論文 参考訳(メタデータ) (2026-02-17T02:46:45Z) - SUFFICIENT: A scan-specific unsupervised deep learning framework for high-resolution 3D isotropic fetal brain MRI reconstruction [7.268308489093152]
等方性HR容積再構成のための教師なし反復SVR-SRRフレームワークを提案する。
高分解能(HR)ボリュームを生成するために、ディープイメージ事前フレームワーク内に埋め込まれたデコードネットワークを包括的画像劣化モデルに組み込む。
大規模動乱シミュレーションデータと臨床データを用いて行った実験は,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2025-05-23T04:53:59Z) - Unified 3D MRI Representations via Sequence-Invariant Contrastive Learning [0.15749416770494706]
自己教師型深層学習は2次元の自然画像解析を加速させたが、3次元MRIへの変換は困難である。
定量的MRI(qMRI)を利用したemph-sequence-invariant self-supervised frameworkを提案する。
健常脳セグメンテーション(IXI)、脳梗塞セグメンテーション(ARC)、MRIによるデノイング実験は、ベースラインSSLアプローチよりも有意な増加を示した。
論文 参考訳(メタデータ) (2025-01-21T11:27:54Z) - MedTet: An Online Motion Model for 4D Heart Reconstruction [59.74234226055964]
本研究は, 術後の軽度データから3次元心臓運動を再構築するための新しいアプローチを提案する。
既存の方法では、フル3次元の体積像から3次元の臓器のジオメトリーを正確に再構築することができる。
このような部分的データから3次元運動を再構築するための汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-03T17:18:33Z) - T-3DGS: Removing Transient Objects for 3D Scene Reconstruction [83.05271859398779]
映像シーケンスにおける過渡的オブジェクトは、3Dシーン再構成の品質を著しく低下させる可能性がある。
我々は,ガウススプラッティングを用いた3次元再構成において,過渡的障害を頑健に除去する新しいフレームワークT-3DGSを提案する。
論文 参考訳(メタデータ) (2024-11-29T07:45:24Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Self-supervised Pre-training with Masked Shape Prediction for 3D Scene
Understanding [106.0876425365599]
Masked Shape Prediction (MSP)は、3Dシーンでマスクされた信号モデリングを行うための新しいフレームワークである。
MSPは3Dセマンティックキュー、すなわち幾何学的形状をマスクされた点の予測ターゲットとして使用する。
論文 参考訳(メタデータ) (2023-05-08T20:09:19Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。