Fugu-MT 論文翻訳(概要): ModeTv2: GPU-accelerated Motion Decomposition Transformer for Pairwise Optimization in Medical Image Registration

論文の概要: ModeTv2: GPU-accelerated Motion Decomposition Transformer for Pairwise Optimization in Medical Image Registration

arxiv url: http://arxiv.org/abs/2403.16526v1
Date: Mon, 25 Mar 2024 08:09:22 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-26 15:28:08.301538
Title: ModeTv2: GPU-accelerated Motion Decomposition Transformer for Pairwise Optimization in Medical Image Registration
Title（参考訳）: ModeTv2: 医用画像登録におけるペアワイズ最適化のためのGPUアクセラレーション動作分解変換器
Authors: Haiqiao Wang, Zhuoyuan Wang, Dong Ni, Yi Wang,
Abstract要約: 変形可能な画像登録は、疾患の診断と画像誘導の介入を支援する医療画像において重要な役割を担っている。従来の反復的手法は遅いが、ディープラーニング(DL)はソリューションを加速するが、ユーザビリティと精度の課題に直面している。本研究では,従来の手法に類似した優れたペアワイズ最適化(PO)を示す改良型モーショントランスフォーマー(ModeTv2)演算子を用いたピラミッドネットワークを提案する。
参考スコア（独自算出の注目度）: 6.217733993535475
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Deformable image registration plays a crucial role in medical imaging, aiding in disease diagnosis and image-guided interventions. Traditional iterative methods are slow, while deep learning (DL) accelerates solutions but faces usability and precision challenges. This study introduces a pyramid network with the enhanced motion decomposition Transformer (ModeTv2) operator, showcasing superior pairwise optimization (PO) akin to traditional methods. We re-implement ModeT operator with CUDA extensions to enhance its computational efficiency. We further propose RegHead module which refines deformation fields, improves the realism of deformation and reduces parameters. By adopting the PO, the proposed network balances accuracy, efficiency, and generalizability. Extensive experiments on two public brain MRI datasets and one abdominal CT dataset demonstrate the network's suitability for PO, providing a DL model with enhanced usability and interpretability. The code is publicly available.
Abstract（参考訳）: 変形可能な画像登録は、疾患の診断と画像誘導の介入を支援する医療画像において重要な役割を担っている。従来の反復的手法は遅いが、ディープラーニング(DL)はソリューションを加速するが、ユーザビリティと精度の課題に直面している。本研究では,従来の手法に類似した優れたペアワイズ最適化(PO)を示す改良された運動分解変換器(ModeTv2)演算子を用いたピラミッドネットワークを提案する。計算効率を向上させるために,CUDA拡張でModeT演算子を再実装する。さらに、変形場を洗練し、変形の現実性を改善し、パラメータを減らすRegHeadモジュールを提案する。 POを採用することで、提案するネットワークは精度、効率、一般化可能性のバランスをとる。 2つのパブリック脳MRIデータセットと1つの腹部CTデータセットに関する大規模な実験は、ネットワークのPOに対する適合性を実証し、ユーザビリティと解釈性を高めたDLモデルを提供する。コードは公開されている。

関連論文リスト

TCIP: Threshold-Controlled Iterative Pyramid Network for Deformable Medical Image Registration [21.283219565079413]
ピラミッドネットワークにおける各デコード層のコアコンポーネントとして機能強化残留モジュール(FERM)を提案する。 FERMは、解剖学的意味的特徴を抽出し、無関係な特徴を抑えることを学習し、最終的な変形場を推定する3つの連続ブロックから構成される。我々は FERM と TCI をThreshold-Controlled Iterative Pyramid (TCIP) として統合するモデルを作成した。
論文参考訳（メタデータ） (2025-10-09T01:38:40Z)
Multimodal signal fusion for stress detection using deep neural networks: a novel approach for converting 1D signals to unified 2D images [0.0]
本研究では,マルチモーダルな信号光胸腺撮影,ガルバニック皮膚反応(GSR),アクセラレーション(ACC)を2次元画像行列に変換する新しい手法を提案する。これらの信号を別々に処理したり、固定符号化に依存したりする従来の手法とは異なり、我々の手法はそれらを構造化画像表現に融合させる。この画像ベースの変換は、解釈可能性を改善するだけでなく、データ拡張の堅牢な形式としても機能する。
論文参考訳（メタデータ） (2025-09-17T02:18:51Z)
BHViT: Binarized Hybrid Vision Transformer [53.38894971164072]
モデルバイナライゼーションは畳み込みニューラルネットワーク(CNN)のリアルタイムおよびエネルギー効率の計算を可能にした。本稿では,バイナライズフレンドリーなハイブリッドViTアーキテクチャであるBHViTとそのバイナライズモデルを提案する。提案アルゴリズムは,バイナリ ViT 手法間でSOTA 性能を実現する。
論文参考訳（メタデータ） (2025-03-04T08:35:01Z)
LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。 LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文参考訳（メタデータ） (2024-07-13T16:09:45Z)
Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する既存の二項化法では性能が著しく低下する。画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文参考訳（メタデータ） (2024-06-09T10:30:25Z)
Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文参考訳（メタデータ） (2023-12-26T12:56:31Z)
SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。 UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文参考訳（メタデータ） (2023-10-16T01:13:38Z)
Latent Diffusion Model for Medical Image Standardization and Enhancement [11.295078152769559]
DiffusionCTは、異なる非標準分布を標準化形式に変換するスコアベースのDDPMモデルである。このアーキテクチャは、ボトルネック位置に統合されたDDPMモデルにより強化されたU-Netベースのエンコーダデコーダを含む。 DiffusionCTによる画像の標準化の顕著な改善が示唆された。
論文参考訳（メタデータ） (2023-10-08T17:11:14Z)
Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。 ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文参考訳（メタデータ） (2023-07-05T13:17:14Z)
ModeT: Learning Deformable Image Registration via Motion Decomposition Transformer [7.629385629884155]
本稿では,複数のモーダルを明示的にモデル化する新しい動作分解変換器 (ModeT) を提案する。提案手法は,現状の登録ネットワークやトランスフォーマーよりも優れている。
論文参考訳（メタデータ） (2023-06-09T06:00:05Z)
GLEAM: Greedy Learning for Large-Scale Accelerated MRI Reconstruction [50.248694764703714]
アンロールされたニューラルネットワークは、最近最先端の加速MRI再構成を達成した。これらのネットワークは、物理ベースの一貫性とニューラルネットワークベースの正規化を交互に組み合わせることで、反復最適化アルゴリズムをアンロールする。我々は,高次元画像設定のための効率的なトレーニング戦略である加速度MRI再構成のためのグレディ・ラーニングを提案する。
論文参考訳（メタデータ） (2022-07-18T06:01:29Z)
Medical Image Registration via Neural Fields [35.80302878742334]
NIR(Neural Image Registration)と呼ばれる新しいニューラルネットベースの画像登録フレームワークを提案する。 2つの3D MR脳スキャンデータセットの実験により、NIRは登録精度と正規性の両方の観点から最先端のパフォーマンスを得る一方で、従来の最適化ベースの手法よりもはるかに高速に動作していることが示された。
論文参考訳（メタデータ） (2022-06-07T08:43:31Z)
Stable Optimization for Large Vision Model Based Deep Image Prior in Cone-Beam CT Reconstruction [6.558735319783205]
LVM(Large Vision Model)は、最近医療画像のタスクにおいて大きな可能性を実証した。 Deep Image Prior(DIP)は、トレーニングされていないニューラルネットワークを効果的にガイドし、トレーニングデータなしで高品質のCBCT画像を生成する。スパースビューCBCTのためのフォワードモデルフリーDIPモデルの安定最適化法を提案する。
論文参考訳（メタデータ） (2022-03-23T15:16:29Z)
Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文参考訳（メタデータ） (2022-03-09T14:56:48Z)
InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文参考訳（メタデータ） (2021-12-23T15:52:37Z)
Enhancing MR Image Segmentation with Realistic Adversarial Data Augmentation [17.539828821476224]
本稿では,学習データの利用効率を向上させるために,逆データ拡張手法を提案する。本稿では,データ拡張モデルとセグメンテーションネットワークを協調的に最適化する汎用的なタスク駆動学習フレームワークを提案する。提案した逆データ拡張は生成ネットワークに依存しず,汎用セグメンテーションネットワークのプラグインモジュールとして使用できる。
論文参考訳（メタデータ） (2021-08-07T11:32:37Z)
Robust Reference-based Super-Resolution via C2-Matching [77.51610726936657]
超解像(Ref-SR)は、最近、高分解能(HR)参照画像を導入して、低分解能(LR)入力画像を強化するための有望なパラダイムとして登場した。既存のRef-SR法は主に暗黙の対応に頼り、参照画像からHRテクスチャを借用し、入力画像の情報損失を補う。本稿では,C2-Matchingを提案する。
論文参考訳（メタデータ） (2021-06-03T16:40:36Z)
Learning Deformable Image Registration from Optimization: Perspective, Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文参考訳（メタデータ） (2020-04-30T03:23:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。