論文の概要: UniFuse: A Unified All-in-One Framework for Multi-Modal Medical Image Fusion Under Diverse Degradations and Misalignments
- arxiv url: http://arxiv.org/abs/2506.22736v1
- Date: Sat, 28 Jun 2025 02:44:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.539627
- Title: UniFuse: A Unified All-in-One Framework for Multi-Modal Medical Image Fusion Under Diverse Degradations and Misalignments
- Title(参考訳): UniFuse: マルチモーダル医療画像融合のための統合オールインワンフレームワーク
- Authors: Dayong Su, Yafei Zhang, Huafeng Li, Jinxing Li, Yu Liu,
- Abstract要約: 現在のマルチモーダル医療画像融合は、典型的には、ソース画像は高品質で、ピクセルレベルで完全に整列していると仮定する。
劣化認識学習モジュールを組み込むことで、UniFuseは入力画像から多方向情報をシームレスに統合する。
本稿では,LoRA の原理に基づく適応型 LoRA Synergistic Network (ALSN) を取り入れた,ユニバーサル・フィーチャー・リカバリ・アンド・フュージョン・モジュールを提案する。
- 参考スコア(独自算出の注目度): 20.348314952092792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current multimodal medical image fusion typically assumes that source images are of high quality and perfectly aligned at the pixel level. Its effectiveness heavily relies on these conditions and often deteriorates when handling misaligned or degraded medical images. To address this, we propose UniFuse, a general fusion framework. By embedding a degradation-aware prompt learning module, UniFuse seamlessly integrates multi-directional information from input images and correlates cross-modal alignment with restoration, enabling joint optimization of both tasks within a unified framework. Additionally, we design an Omni Unified Feature Representation scheme, which leverages Spatial Mamba to encode multi-directional features and mitigate modality differences in feature alignment. To enable simultaneous restoration and fusion within an All-in-One configuration, we propose a Universal Feature Restoration & Fusion module, incorporating the Adaptive LoRA Synergistic Network (ALSN) based on LoRA principles. By leveraging ALSN's adaptive feature representation along with degradation-type guidance, we enable joint restoration and fusion within a single-stage framework. Compared to staged approaches, UniFuse unifies alignment, restoration, and fusion within a single framework. Experimental results across multiple datasets demonstrate the method's effectiveness and significant advantages over existing approaches.
- Abstract(参考訳): 現在のマルチモーダル医療画像融合は、典型的には、ソース画像は高品質で、ピクセルレベルで完全に整列していると仮定する。
その効果はこれらの条件に大きく依存しており、不整合や劣化した医療画像を扱う際にしばしば悪化する。
そこで本研究では,一般融合フレームワークUniFuseを提案する。
UniFuseは、劣化認識型プロンプト学習モジュールを組み込むことで、入力画像からの多方向情報をシームレスに統合し、相互のアライメントと復元を相関させ、統合されたフレームワーク内で両方のタスクを共同で最適化する。
さらに、空間マンバを利用して多方向特徴を符号化し、特徴アライメントにおけるモダリティ差を緩和するOmni Unified Feature Representationスキームを設計する。
オールインワン構成内での同時復元と融合を可能にするために,ロラ原理に基づく適応ロラ合成ネットワーク(ALSN)を組み込んだユニバーサル・フィーチャー・リカバリ・アンド・フュージョン・モジュールを提案する。
ALSNの適応的特徴表現と劣化型ガイダンスを利用することで、単一ステージフレームワーク内での関節修復と融合を可能にする。
ステージ化されたアプローチと比較して、UniFuseは単一のフレームワーク内でアライメント、復元、融合を統一する。
複数のデータセットにまたがる実験結果は、既存のアプローチに対する手法の有効性と大きなアドバンテージを示す。
関連論文リスト
- Bi-directional Self-Registration for Misaligned Infrared-Visible Image Fusion [53.60977801655896]
高品質なマルチモーダル画像融合を実現するためには,高精度なマルチモーダル画像ペアの取得が不可欠である。
我々は、新しい自己教師型 textbfBi-directional textbfSelf-textbfRegistration framework (textbfB-SR) を提案する。
論文 参考訳(メタデータ) (2025-05-11T09:36:25Z) - Learning a Unified Degradation-aware Representation Model for Multi-modal Image Fusion [13.949209965987308]
All-in-One Degradation-Aware Fusion Models (ADFM)は、ソース画像からの劣化を軽減し、高品質の融合画像を生成することで複雑なシーンに対処する。
メインストリームADFMは、しばしば高度に合成されたマルチモーダル・マルチクオリティ・イメージを監督に頼り、クロスモーダルおよび希少な劣化シナリオにおけるその有効性を制限している。
本稿では、赤外線と可視画像融合のための学習駆動統一表現モデルLUREについて述べる。
論文 参考訳(メタデータ) (2025-03-10T08:16:36Z) - BSAFusion: A Bidirectional Stepwise Feature Alignment Network for Unaligned Medical Image Fusion [11.306367018981678]
本稿では,両方向ステップワイド・フィーチャーアライメントとフュージョンという,不整合な医用画像融合法を提案する。
特徴アライメントの観点では、BSFA-Fは双方向の段階的なアライメント変形場予測戦略を採用している。
複数のデータセットにまたがる実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-12-11T02:56:23Z) - Fusion from Decomposition: A Self-Supervised Approach for Image Fusion and Beyond [74.96466744512992]
画像融合の本質は、ソース画像からの相補的な情報を統合することである。
DeFusion++は、画像融合の品質を高め、下流の高レベル視覚タスクの有効性を高める、汎用的な融合表現を生成する。
論文 参考訳(メタデータ) (2024-10-16T06:28:49Z) - Unified Frequency-Assisted Transformer Framework for Detecting and
Grounding Multi-Modal Manipulation [109.1912721224697]
本稿では、DGM4問題に対処するため、UFAFormerという名前のUnified Frequency-Assisted TransFormerフレームワークを提案する。
離散ウェーブレット変換を利用して、画像を複数の周波数サブバンドに分解し、リッチな顔偽造品をキャプチャする。
提案する周波数エンコーダは、帯域内およびバンド間自己アテンションを組み込んだもので、多種多様なサブバンド内および多種多様なフォージェリー特徴を明示的に集約する。
論文 参考訳(メタデータ) (2023-09-18T11:06:42Z) - Equivariant Multi-Modality Image Fusion [124.11300001864579]
エンドツーエンドの自己教師型学習のための同変多モードImAge融合パラダイムを提案する。
我々のアプローチは、自然画像応答が特定の変換に等しくなるという以前の知識に根ざしている。
実験により、EMMAは赤外線可視画像と医用画像に高品質な融合結果をもたらすことが確認された。
論文 参考訳(メタデータ) (2023-05-19T05:50:24Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。