論文の概要: Efficient Complex-Valued Vision Transformers for MRI Classification Directly from k-Space
- arxiv url: http://arxiv.org/abs/2601.18392v1
- Date: Mon, 26 Jan 2026 11:50:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.803913
- Title: Efficient Complex-Valued Vision Transformers for MRI Classification Directly from k-Space
- Title(参考訳): k-スペースから直接のMRI分類のための高能率複素値変換器
- Authors: Moritz Rempe, Lukas T. Rotkopf, Marco Schlimbach, Helmut Becker, Fabian Hörst, Johannes Haubold, Philipp Dammann, Kevin Kröninger, Jens Kleesiek,
- Abstract要約: 磁気共鳴イメージング(MRI)における深層学習の応用は、主に再構成された等級画像に対して行われる。
標準的なニューラルネットワークアーキテクチャは、生周波数領域(k-Space)データのグローバルで非ローカルな性質に不適なローカル操作(畳み込みやグリッドパッチ)に依存している。
そこで本研究では,k-Spaceデータに基づく分類を行うために,複雑な値を持つ視覚変換器(kViT)を提案する。
- 参考スコア(独自算出の注目度): 4.973425214325723
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep learning applications in Magnetic Resonance Imaging (MRI) predominantly operate on reconstructed magnitude images, a process that discards phase information and requires computationally expensive transforms. Standard neural network architectures rely on local operations (convolutions or grid-patches) that are ill-suited for the global, non-local nature of raw frequency-domain (k-Space) data. In this work, we propose a novel complex-valued Vision Transformer (kViT) designed to perform classification directly on k-Space data. To bridge the geometric disconnect between current architectures and MRI physics, we introduce a radial k-Space patching strategy that respects the spectral energy distribution of the frequency-domain. Extensive experiments on the fastMRI and in-house datasets demonstrate that our approach achieves classification performance competitive with state-of-the-art image-domain baselines (ResNet, EfficientNet, ViT). Crucially, kViT exhibits superior robustness to high acceleration factors and offers a paradigm shift in computational efficiency, reducing VRAM consumption during training by up to 68$\times$ compared to standard methods. This establishes a pathway for resource-efficient, direct-from-scanner AI analysis.
- Abstract(参考訳): 磁気共鳴イメージング(MRI)におけるディープラーニングの応用は、主に位相情報を破棄し、計算に高価な変換を必要とする、再構成された等級画像を扱う。
標準的なニューラルネットワークアーキテクチャは、生周波数領域(k-Space)データのグローバルで非ローカルな性質に不適なローカル操作(畳み込みやグリッドパッチ)に依存している。
そこで本研究では,k-Spaceデータに基づく分類を行うために,複雑な値を持つ視覚変換器(kViT)を提案する。
現在のアーキテクチャとMRI物理の幾何学的断絶を橋渡しするために、周波数領域のスペクトルエネルギー分布を尊重する放射状k空間パッチ戦略を導入する。
画像領域ベースライン(ResNet,EfficientNet,ViT)と競合する分類性能を実現していることを示す。
重要な点として、kViTは高い加速係数に対して優れた堅牢性を示し、計算効率のパラダイムシフトを提供し、トレーニング中のVRAM消費を標準手法と比較して最大68$\times$まで削減する。
これにより、リソース効率のよい直接スキャンAI分析の経路が確立される。
関連論文リスト
- Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:12:26Z) - K-Syn: K-space Data Synthesis in Ultra Low-data Regimes [0.7817545394809559]
このレターは周波数領域の機能レベルのモデリングに焦点をあて、超低データ状態であっても安定でリッチな生成を可能にする。
我々は、時間枠にまたがるk空間データを複数の融合戦略と統合し、生成軌道を操り、さらに最適化する。
実験により, 提案手法は低データレシエーションにおいて強い生成能力を有することが示された。
論文 参考訳(メタデータ) (2025-09-04T12:25:05Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - Deep Learning-based MRI Reconstruction with Artificial Fourier Transform Network (AFTNet) [14.146848823672677]
複合価値ディープラーニングフレームワーク-Artificial Fourier Transform Network (AFTNet)を導入する。
AFTNetは、ドメイン変換における画像逆問題の解決に容易に利用できる。
AFTNetは既存のアプローチに比べ,MRIの高速化に優れることを示す。
論文 参考訳(メタデータ) (2023-12-18T02:50:45Z) - Global k-Space Interpolation for Dynamic MRI Reconstruction using Masked
Image Modeling [10.74920257710449]
ダイナミックMRI(Dynamic Magnetic Imaging)では、k空間はスキャン時間に制限があるためアンサンプされることが多い。
我々は,k-GINと呼ばれるトランスフォーマーベースのk空間グローバル補間ネットワークを提案する。
我々のk-GINは、2D+t k空間の低周波成分と高周波成分のグローバル依存関係を学習し、アンサンプされたデータを補間する。
論文 参考訳(メタデータ) (2023-07-24T10:20:14Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - LWGNet: Learned Wirtinger Gradients for Fourier Ptychographic Phase
Retrieval [14.588976801396576]
本稿では,フォワードイメージングシステムの知識と深層データ駆動ネットワークを組み合わせたハイブリッドモデル駆動残差ネットワークを提案する。
従来のアンローリング技術とは異なり、LWGNetは従来のディープ・ラーニング・テクニックよりも少ない段数しか使用していない。
この低ビット深度・低コストセンサの性能向上は、FPM撮像装置のコストを大幅に下げる可能性がある。
論文 参考訳(メタデータ) (2022-08-08T17:22:54Z) - Cross-Modality High-Frequency Transformer for MR Image Super-Resolution [100.50972513285598]
我々はTransformerベースのMR画像超解像フレームワークを構築するための初期の取り組みを構築した。
我々は、高周波構造とモード間コンテキストを含む2つの領域先行について考察する。
我々は,Cross-modality High- frequency Transformer (Cohf-T)と呼ばれる新しいTransformerアーキテクチャを構築し,低解像度画像の超解像化を実現する。
論文 参考訳(メタデータ) (2022-03-29T07:56:55Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。