論文の概要: Conti-Fuse: A Novel Continuous Decomposition-based Fusion Framework for Infrared and Visible Images
- arxiv url: http://arxiv.org/abs/2406.04689v2
- Date: Wed, 27 Nov 2024 11:18:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 15:23:28.364297
- Title: Conti-Fuse: A Novel Continuous Decomposition-based Fusion Framework for Infrared and Visible Images
- Title(参考訳): Conti-Fuse:赤外線と可視画像のための新しい連続分解型融合フレームワーク
- Authors: Hui Li, Haolong Ma, Chunyang Cheng, Zhongwei Shen, Xiaoning Song, Xiao-Jun Wu,
- Abstract要約: モーダル間および内部モーダル関係のための連続分解に基づく融合フレームワーク(Conti-Fuse)を提案する。
提案したConti-Fuseは,最先端の融合法よりも優れた性能を実現する。
- 参考スコア(独自算出の注目度): 11.50274982747009
- License:
- Abstract: For better explore the relations of inter-modal and inner-modal, even in deep learning fusion framework, the concept of decomposition plays a crucial role. However, the previous decomposition strategies (base \& detail or low-frequency \& high-frequency) are too rough to present the common features and the unique features of source modalities, which leads to a decline in the quality of the fused images. The existing strategies treat these relations as a binary system, which may not be suitable for the complex generation task (e.g. image fusion). To address this issue, a continuous decomposition-based fusion framework (Conti-Fuse) is proposed. Conti-Fuse treats the decomposition results as few samples along the feature variation trajectory of the source images, extending this concept to a more general state to achieve continuous decomposition. This novel continuous decomposition strategy enhances the representation of complementary information of inter-modal by increasing the number of decomposition samples, thus reducing the loss of critical information. To facilitate this process, the continuous decomposition module (CDM) is introduced to decompose the input into a series continuous components. The core module of CDM, State Transformer (ST), is utilized to efficiently capture the complementary information from source modalities. Furthermore, a novel decomposition loss function is also designed which ensures the smooth progression of the decomposition process while maintaining linear growth in time complexity with respect to the number of decomposition samples. Extensive experiments demonstrate that our proposed Conti-Fuse achieves superior performance compared to the state-of-the-art fusion methods.
- Abstract(参考訳): モーダル間とインナーモーダル間の関係をより深く探求するためには、深層学習融合フレームワークにおいても、分解の概念が重要な役割を担っている。
しかし、従来の分解戦略(ベース・アンド・ディテールや低周波・高周波)は、一般的な特徴やソース・モダリティの特徴を提示するには大きすぎるため、融合画像の品質は低下する。
既存の戦略ではこれらの関係をバイナリシステムとして扱うが、複雑な生成タスク(例えば画像融合)には適さないかもしれない。
この問題に対処するために,連続分解に基づく融合フレームワーク(Conti-Fuse)を提案する。
Conti-Fuseは、分解結果をソース画像の特徴変化軌跡に沿った少数のサンプルとして扱い、この概念をより一般的な状態に拡張し、連続的な分解を実現する。
この新たな連続分解戦略は、分解サンプルの数を増やすことにより、モーダル間の相補的な情報の表現を強化し、臨界情報の損失を低減する。
このプロセスを容易にするために、連続分解モジュール(CDM)を導入し、入力を連続したコンポーネントに分解する。
CDMの中核モジュールであるState Transformer (ST) は、ソースモードから補完情報を効率的に取得するために使用される。
さらに, 分解サンプル数の線形成長を維持しつつ, 分解過程の円滑な進行を確実にする新しい分解損失関数も設計されている。
大規模実験により,提案手法は現状の核融合法よりも優れた性能を示した。
関連論文リスト
- Federated Low-Rank Tensor Estimation for Multimodal Image Reconstruction [9.075990246977891]
本研究では,大規模マルチモーダルデータを管理するために,タッカー分解を適用し,共同分解とランダムなスケッチ処理を取り入れたフェデレーション画像再構成手法を提案する。
提案手法は,既存手法と比較して,再現性や通信圧縮に優れることを示す。
論文 参考訳(メタデータ) (2025-02-04T23:02:46Z) - InterLCM: Low-Quality Images as Intermediate States of Latent Consistency Models for Effective Blind Face Restoration [106.70903819362402]
拡散前駆体は、低画質画像の復元のために、復元データセットの微細調整拡散モデル(DM)によってブラインドフェイス復元(BFR)に使用されている。
我々は,その優れたセマンティック一貫性と効率のために潜在一貫性モデル(LCM)を活用するために,InterLCMを提案する。
InterLCMは、合成データセットと実世界のデータセットの両方において既存のアプローチより優れており、推論速度も高速である。
論文 参考訳(メタデータ) (2025-02-04T10:51:20Z) - Modality Decoupling is All You Need: A Simple Solution for Unsupervised Hyperspectral Image Fusion [12.622742399195209]
ハイパースペクトル画像融合(HIF)は、低分解能ハイパースペクトル画像(LR-HSI)と高分解能マルチスペクトル画像(HR-MSI)を融合することを目的としている。
現在の方法は通常、2つのモダリティからの直接融合を有効な監督なしに適用する。
本研究では,HIF にモダリティデカップリングが不可欠であると仮定した,教師なし HIF に対する単純かつ効果的な解を提案する。
論文 参考訳(メタデータ) (2024-12-06T06:22:43Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition [68.6707284662443]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的および静的なシーンの復元を目指している。
1つの重要な側面は、時間空間照明と外観強化バージョンに特化した一貫性の制約を定式化することである。
本稿では,レチネックスを基盤とした革新的なビデオ分解戦略について述べる。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.47005445345593]
BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-03-15T11:21:34Z) - FuseFormer: A Transformer for Visual and Thermal Image Fusion [3.6064695344878093]
本稿では,従来の評価指標を損失関数として用いた場合の限界を緩和する画像融合問題に対する新しい手法を提案する。
提案手法は,局所的およびグローバルなコンテキスト情報に順応的に対処するトランスフォーマーベースのマルチスケール融合戦略を統合する。
提案手法は,新たな損失関数の定義とともに,他の競合融合アルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-01T19:40:39Z) - Reti-Diff: Illumination Degradation Image Restoration with Retinex-based
Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。
これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。
我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。
Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文 参考訳(メタデータ) (2023-11-20T09:55:06Z) - DDFM: Denoising Diffusion Model for Multi-Modality Image Fusion [144.9653045465908]
拡散確率モデル(DDPM)に基づく新しい融合アルゴリズムを提案する。
近赤外可視画像融合と医用画像融合で有望な融合が得られた。
論文 参考訳(メタデータ) (2023-03-13T04:06:42Z) - Bridging Component Learning with Degradation Modelling for Blind Image
Super-Resolution [69.11604249813304]
視覚障害者のためのコンポーネント分解・協調最適化ネットワーク(CDCN)を提案する。
CDCNは入力LR画像を特徴空間の構造と詳細成分に分解する。
本稿では,HR画像の細部と構造復元過程を協調的に監督する,劣化駆動型学習戦略を提案する。
論文 参考訳(メタデータ) (2022-12-03T14:53:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。