論文の概要: Vision-Language Model-Guided Deep Unrolling Enables Personalized, Fast MRI
- arxiv url: http://arxiv.org/abs/2604.06849v1
- Date: Wed, 08 Apr 2026 09:10:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.446905
- Title: Vision-Language Model-Guided Deep Unrolling Enables Personalized, Fast MRI
- Title(参考訳): 個人化された高速MRIを実現するビジョンランゲージモデルによる深層展開
- Authors: Fangmao Ju, Yuzhu He, Zhiwen Xue, Chunfeng Lian, Jianhua Ma,
- Abstract要約: PASS(Personalized, Anomaly-aware Sampling and reconStruction)は、タスク指向の高速イメージングのためのディープアンローリングネットワークをガイドするインテリジェントMRIフレームワークである。
PASSは、様々な解剖、コントラスト、異常、加速度因子にまたがる優れた画像品質を実現する。
この拡張は、微粒な異常検出、局所化、診断を含む下流診断タスクの改善に直接変換される。
- 参考スコア(独自算出の注目度): 5.617068536645436
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Magnetic Resonance Imaging (MRI) is a cornerstone in medicine and healthcare but suffers from long acquisition times. Traditional accelerated MRI methods optimize for generic image quality, lacking adaptability for specific clinical tasks. To address this, we introduce PASS (Personalized, Anomaly-aware Sampling and reconStruction), an intelligent MRI framework that leverages a Vision-Language Model (VLM) to guide a deep unrolling network for task-oriented, fast imaging. PASS dynamically personalizes the imaging pipeline through three core contributions: (1) a deep unrolled reconstruction network derived from a physics-based MRI model; (2) a sampling module that generates patient-specific $k$-space trajectories; and (3) an anomaly-aware prior, extracted from a pretrained VLM, which steers both sampling and reconstruction toward clinically relevant regions. By integrating the high-level clinical reasoning of a VLM with an interpretable, physics-aware network, PASS achieves superior image quality across diverse anatomies, contrasts, anomalies, and acceleration factors. This enhancement directly translates to improvements in downstream diagnostic tasks, including fine-grained anomaly detection, localization, and diagnosis.
- Abstract(参考訳): 磁気共鳴イメージング(MRI)は医学と医療の基盤であるが、長い取得時間に悩まされている。
従来の加速MRI法は、一般的な画像品質を最適化し、特定の臨床タスクへの適応性を欠いている。
そこで我々は,視覚言語モデル(VLM)を活用し,タスク指向の高速撮像のためのディープアンローリングネットワークをガイドする,インテリジェントMRIフレームワークPASS(Personalized, Anomaly-aware Sampling and reconStruction)を導入する。
PASSは,(1)物理ベースのMRIモデルから派生した深層無回転再構成ネットワーク,(2)患者固有の$k$-空間軌跡を生成するサンプリングモジュール,(3)事前訓練されたVLMから抽出された異常認識モジュール,の3つのコアコントリビューションを通じて画像パイプラインを動的にパーソナライズする。
VLMの高レベルな臨床推論を解釈可能な物理認識ネットワークに統合することにより、PASSは様々な解剖学、コントラスト、異常、加速因子にまたがる優れた画像品質を実現する。
この拡張は、微粒な異常検出、局所化、診断を含む下流診断タスクの改善に直接変換する。
関連論文リスト
- Single-Subject Multi-View MRI Super-Resolution via Implicit Neural Representations [4.471119405879635]
SIMS-MRI(Single-Subject Implicit Multi-View Super-Resolution for MRI)を紹介する。
SIMS-MRIは、前処理や後処理を必要とせず、単一の患者からの異方性マルチビュースキャンのみで動作する。
提案手法は,複数解像度のハッシュ符号化された暗黙表現と学習されたビュー間アライメントを組み合わせることで,空間的に一貫した等方的再構成を生成する。
論文 参考訳(メタデータ) (2026-03-23T23:00:18Z) - SSPFormer: Self-Supervised Pretrained Transformer for MRI Images [10.727804908369869]
本稿では,MRI画像のための自己教師付き事前学習変換器(SSPFormer)を提案する。
SSPFormerは、未ラベルの生画像データを利用して、医用画像のドメイン固有の特徴表現を効果的に学習する。
セグメンテーション、超解像、デノゲーションタスクに関する広範な実験を通じて、提案したSSPFormerは最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-01-19T06:01:13Z) - Decipher-MR: A Vision-Language Foundation Model for 3D MRI Representations [12.805804608410739]
Decipher-MRは、大規模なデータセットに基づいて訓練された3次元MRI固有の視覚言語基盤モデルである。
Decipher-MRは、自己指導型視覚学習とレポート誘導型テキスト監視を統合し、堅牢で一般化可能な表現を構築する。
以上の結果から,Decipher-MRはMRIベースのAIのスケーラブルで汎用的な基盤として確立され,臨床および研究領域における効率的な開発が促進される。
論文 参考訳(メタデータ) (2025-09-25T14:43:33Z) - M3Ret: Unleashing Zero-shot Multimodal Medical Image Retrieval via Self-Supervision [24.846428105192405]
我々は、モダリティ固有のカスタマイズなしで、統一されたビジュアルエンコーダであるM3Retを訓練する。
生成的(MAE)およびコントラスト的(SimDINO)自己教師型学習(SSL)パラダイムを用いて、転送可能な表現をうまく学習する。
提案手法は,DINOv3 やテキスト教師付き BMC-CLIP などの強力なベースラインを超越して,すべてのモダリティを横断するゼロショット画像画像検索において,新たな最先端技術を実現する。
論文 参考訳(メタデータ) (2025-09-01T10:59:39Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Coordinate-Based Neural Representation Enabling Zero-Shot Learning for 3D Multiparametric Quantitative MRI [4.707353256136099]
我々は,同時マルチパラメトリックqMRIのためのデータ取得と教師なし再構成を含む,革新的なイメージング手法であるSUMMITを提案する。
qMRI再構成のための教師なしアプローチは、様々な医用画像モダリティに適用可能な、新しいゼロショット学習パラダイムも導入する。
論文 参考訳(メタデータ) (2024-10-02T14:13:06Z) - MindFormer: Semantic Alignment of Multi-Subject fMRI for Brain Decoding [50.55024115943266]
本稿では,MindFormer を用いたマルチオブジェクト fMRI 信号のセマンティックアライメント手法を提案する。
このモデルは、fMRIから画像生成のための安定拡散モデルや、fMRIからテキスト生成のための大規模言語モデル(LLM)の条件付けに使用できるfMRI条件付き特徴ベクトルを生成するように設計されている。
実験の結果,MindFormerは意味的に一貫した画像とテキストを異なる主題にわたって生成することがわかった。
論文 参考訳(メタデータ) (2024-05-28T00:36:25Z) - NeuroPictor: Refining fMRI-to-Image Reconstruction via Multi-individual Pretraining and Multi-level Modulation [55.51412454263856]
本稿では,fMRI信号を用いた拡散モデル生成過程を直接変調することを提案する。
様々な個人から約67,000 fMRI-imageペアのトレーニングを行うことで,fMRI-to-imageデコーディング能力に優れたモデルが得られた。
論文 参考訳(メタデータ) (2024-03-27T02:42:52Z) - fMRI-PTE: A Large-scale fMRI Pretrained Transformer Encoder for
Multi-Subject Brain Activity Decoding [54.17776744076334]
本稿では,fMRI事前学習のための革新的オートエンコーダであるfMRI-PTEを提案する。
我々のアプローチでは、fMRI信号を統合された2次元表現に変換し、次元の整合性を確保し、脳の活動パターンを保存する。
コントリビューションには、fMRI-PTEの導入、革新的なデータ変換、効率的なトレーニング、新しい学習戦略、そして我々のアプローチの普遍的な適用性が含まれる。
論文 参考訳(メタデータ) (2023-11-01T07:24:22Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。