論文の概要: EAPFusion: Intrinsic Evolving Auxiliary Prior Guidance for Infrared and Visible Image Fusion
- arxiv url: http://arxiv.org/abs/2605.01916v1
- Date: Sun, 03 May 2026 14:56:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.995008
- Title: EAPFusion: Intrinsic Evolving Auxiliary Prior Guidance for Infrared and Visible Image Fusion
- Title(参考訳): EAPFusion:赤外・可視画像融合のための補助補助前誘導の本質的進化
- Authors: Zhenyu Sun, Luobin Zhang, Axi Niu, Haishen Wang, Qingsen Yan,
- Abstract要約: 赤外線可視画像融合は、赤外線センシングによる相補的な熱塩分と、可視画像からの微細なテクスチャを統合することで、情報に富んだ融合画像を作成することを目的としている。
既存の融合法の多くは、推論時にシーン固有のコンテンツに適応できない静的なトレーニングされた重みに依存している。
本研究では,外部補助モデルに頼らず,自己進化型固有の先行モデルを用いて,これらの問題に対処するEAPFusionを提案する。
- 参考スコア(独自算出の注目度): 15.580984590527343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared-visible image fusion aims to create an information-rich fused image by integrating the complementary thermal saliency from infrared sensing and fine textures from visible imaging. Such accurate fusion is essential for real-world perception applications in complex scenes, including nighttime autonomous driving, search and rescue, and surveillance, and can further benefit downstream tasks such as semantic segmentation. However, most existing fusion methods rely upon static trained weights that cannot adapt to scene-specific content at inference time, and often suffer from a granularity mismatch when coarse auxiliary semantics are injected, which makes it difficult to simultaneously highlight targets and preserve details. In this work, we propose EAPFusion to address these issues by using self-evolving intrinsic priors instead of relying on external auxiliary models. Concretely, EAPFusion maintains a compact set of intrinsic priors and progressively updates them across scales. These evolved priors are utilized to dynamically generate convolutional kernels, shifting the paradigm from fixed, pre-trained filters to instance-adaptive parameters via prior-conditioned dynamic convolution. Furthermore, we design a channel-level fusion module that shuffles and interleaves infrared and visible channels, applying local channel mixing to boost cross-modal complementarity. Experiments on different datasets, including cross-dataset evaluation and semantic segmentation, show that the proposed method achieves state-of-the-art quantitative and qualitative fusion results, and consistently boosts downstream performance. Code is coming soon.
- Abstract(参考訳): 赤外線可視画像融合は、赤外線センシングによる相補的な熱塩分と、可視画像からの微細なテクスチャを統合することで、情報に富んだ融合画像を作成することを目的としている。
このような正確な融合は、夜間自律運転、捜索救助、監視を含む複雑な場面における現実世界の知覚応用に不可欠であり、セマンティックセグメンテーションのような下流のタスクにさらに恩恵を与えることができる。
しかし、既存の融合法の多くは、推論時にシーン固有のコンテンツに適応できない静的なトレーニングされた重みに依存しており、粗いセカンダリセマンティクスが注入された場合、しばしば粒度のミスマッチに悩まされるため、ターゲットを同時に強調し、詳細を保存することは困難である。
本研究では,外部補助モデルに頼らず,自己進化型本質的先行モデルを用いて,これらの問題に対処するEAPFusionを提案する。
具体的には、EAPFusionは、固有の事前のコンパクトなセットを維持し、スケールにわたって徐々に更新する。
これらの進化した先行は、動的に畳み込みカーネルを生成するために利用され、固定されたトレーニング済みフィルタから、事前条件付き動的畳み込みによるインスタンス適応パラメータへパラダイムをシフトする。
さらに、赤外線と可視光のチャネルをシャッフルし、インターリーブするチャネルレベルの融合モジュールを設計し、局所的なチャネル混合を適用し、モジュール間の相補性を向上する。
クロスデータセット評価やセマンティックセグメンテーションなどの異なるデータセットの実験により,提案手法が最先端の定量的・定性的な融合結果を実現し,ダウンストリーム性能を継続的に向上することを示す。
もうすぐコードがやってくる。
関連論文リスト
- CtrlFuse: Mask-Prompt Guided Controllable Infrared and Visible Image Fusion [51.060328159429154]
赤外線と可視画像の融合は、相補的なモダリティを組み合わせることで、全天候の知覚可能な画像を生成する。
我々は,マスクプロンプトによって誘導されるインタラクティブな動的融合を可能にする,制御可能な画像融合フレームワークであるCtrlFuseを提案する。
実験では、融合制御性とセグメンテーション精度の両立を実証し、適応されたタスク分岐は元のセグメンテーションモデルよりも優れていた。
論文 参考訳(メタデータ) (2026-01-12T13:36:48Z) - SGDFuse: SAM-Guided Diffusion for High-Fidelity Infrared and Visible Image Fusion [65.80051636480836]
本稿では,Segment Anything Model(SAM)によって導かれる条件拡散モデルを提案する。
このフレームワークは2段階のプロセスで動作し、まずマルチモーダルな特徴の予備的な融合を行い、その後、拡散モデルの粗大な分極生成を駆動する条件としてセマンティックマスクを利用する。
SGDFuseは主観的評価と客観的評価の両方において最先端の性能を発揮することを示す。
論文 参考訳(メタデータ) (2025-08-07T10:58:52Z) - CoCoNet: Coupled Contrastive Learning Network with Multi-level Feature Ensemble for Multi-modality Image Fusion [68.78897015832113]
我々は、赤外線と可視画像の融合を実現するために、CoCoNetと呼ばれるコントラスト学習ネットワークを提案する。
本手法は,主観的評価と客観的評価の両面において,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-11-20T12:02:07Z) - TGFuse: An Infrared and Visible Image Fusion Approach Based on
Transformer and Generative Adversarial Network [15.541268697843037]
本稿では,軽量トランスモジュールと対向学習に基づく赤外可視画像融合アルゴリズムを提案する。
大域的相互作用力にインスパイアされた我々は、トランスフォーマー技術を用いて、効果的な大域的核融合関係を学習する。
実験により提案したモジュールの有効性が実証された。
論文 参考訳(メタデータ) (2022-01-25T07:43:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。