論文の概要: Hyperbolic Cycle Alignment for Infrared-Visible Image Fusion
- arxiv url: http://arxiv.org/abs/2507.23508v1
- Date: Thu, 31 Jul 2025 12:45:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:09.737895
- Title: Hyperbolic Cycle Alignment for Infrared-Visible Image Fusion
- Title(参考訳): 赤外線可視画像融合のためのハイパーボリックサイクルアライメント
- Authors: Timing Li, Bing Cao, Jiahe Feng, Haifang Cao, Qinghau Hu, Pengfei Zhu,
- Abstract要約: Hy-CycleAlignは双曲空間に基づく最初の画像登録法である。
後方登録ネットワークは、元の画像を再構成し、幾何学的整合性のある閉ループ登録構造を形成する。
ユークリッド空間と双曲空間の両方における画像登録を解析し、双曲空間がより敏感で効果的なマルチモーダル画像登録を可能にすることを示す。
- 参考スコア(独自算出の注目度): 21.398951409352364
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image fusion synthesizes complementary information from multiple sources, mitigating the inherent limitations of unimodal imaging systems. Accurate image registration is essential for effective multi-source data fusion. However, existing registration methods, often based on image translation in Euclidean space, fail to handle cross-modal misalignment effectively, resulting in suboptimal alignment and fusion quality. To overcome this limitation, we explore image alignment in non-Euclidean space and propose a Hyperbolic Cycle Alignment Network (Hy-CycleAlign). To the best of our knowledge, Hy-CycleAlign is the first image registration method based on hyperbolic space. It introduces a dual-path cross-modal cyclic registration framework, in which a forward registration network aligns cross-modal inputs, while a backward registration network reconstructs the original image, forming a closed-loop registration structure with geometric consistency. Additionally, we design a Hyperbolic Hierarchy Contrastive Alignment (H$^{2}$CA) module, which maps images into hyperbolic space and imposes registration constraints, effectively reducing interference caused by modality discrepancies. We further analyze image registration in both Euclidean and hyperbolic spaces, demonstrating that hyperbolic space enables more sensitive and effective multi-modal image registration. Extensive experiments on misaligned multi-modal images demonstrate that our method significantly outperforms existing approaches in both image alignment and fusion. Our code will be publicly available.
- Abstract(参考訳): 画像融合は、複数のソースからの相補的な情報を合成し、一方向イメージングシステムの固有の限界を緩和する。
効率的なマルチソースデータ融合には,正確な画像登録が不可欠である。
しかしながら、ユークリッド空間における画像翻訳に基づく既存の登録法は、モーダル間ミスアライメントを効果的に扱えないため、最適以下のアライメントと融合品質が得られる。
この制限を克服するため、非ユークリッド空間における画像アライメントを探索し、ハイパーボリックサイクルアライメントネットワーク(Hy-CycleAlign)を提案する。
我々の知る限りでは、Hy-CycleAlignは双曲空間に基づく最初の画像登録法である。
フォワード登録ネットワークがクロスモーダル入力を整列するデュアルパスクロスモーダル循環登録フレームワークを導入し、後方登録ネットワークが元の画像を再構成し、幾何整合性のある閉ループ登録構造を形成する。
さらに,画像を双曲空間にマッピングし,登録制約を課し,モダリティの相違による干渉を効果的に軽減するH$^{2}$CA(Hyperbolic Hierarchy Contrastive Alignment)モジュールを設計する。
さらに、ユークリッド空間と双曲空間の両方における画像登録を分析し、双曲空間がより敏感で効果的なマルチモーダル画像登録を可能にすることを示す。
本手法は画像アライメントと融合の両面で既存手法よりも優れていることを示す。
私たちのコードは公開されます。
関連論文リスト
- Bi-directional Self-Registration for Misaligned Infrared-Visible Image Fusion [53.60977801655896]
高品質なマルチモーダル画像融合を実現するためには,高精度なマルチモーダル画像ペアの取得が不可欠である。
我々は、新しい自己教師型 textbfBi-directional textbfSelf-textbfRegistration framework (textbfB-SR) を提案する。
論文 参考訳(メタデータ) (2025-05-11T09:36:25Z) - BusReF: Infrared-Visible images registration and fusion focus on
reconstructible area using one set of features [39.575353043949725]
マルチモーダルカメラが連携するシナリオでは、非アライメント画像を扱う際の問題は回避できない。
既存の画像融合アルゴリズムは、より正確な融合結果を得るために、厳密に登録された入力画像対に大きく依存している。
本稿では,BusRefと呼ばれる単一のフレームワークにおける画像登録と融合の問題に対処することを目的とする。
論文 参考訳(メタデータ) (2023-12-30T17:32:44Z) - Layered Rendering Diffusion Model for Controllable Zero-Shot Image Synthesis [15.76266032768078]
本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
まず、摂動分布の基本的な空間的キューとして視覚誘導を導入する。
本稿では,複数のレイヤからなる画像レンダリングプロセスを構築する汎用フレームワークであるLayered Rendering Diffusion (LRDiff)を提案する。
論文 参考訳(メタデータ) (2023-11-30T10:36:19Z) - Improving Misaligned Multi-modality Image Fusion with One-stage
Progressive Dense Registration [67.23451452670282]
多モード画像間の相違は、画像融合の課題を引き起こす。
マルチスケールプログレッシブ・センス・レジストレーション方式を提案する。
このスキームは、一段階最適化のみで粗大な登録を行う。
論文 参考訳(メタデータ) (2023-08-22T03:46:24Z) - Generating Aligned Pseudo-Supervision from Non-Aligned Data for Image
Restoration in Under-Display Camera [84.41316720913785]
トレーニングデータ収集のための古典的なステレオセットアップを再考する -- 同じシーンの2つの画像を1つのUDCと1つの標準カメラでキャプチャする。
鍵となるアイデアは、高品質な参照イメージから詳細を"コピー"し、UDCイメージ上でそれらを"ペースト"することです。
トランスフォーマーベースの新しいフレームワークは、対応するUDC入力に対して、整合性はあるが高品質なターゲットデータを生成する。
論文 参考訳(メタデータ) (2023-04-12T17:56:42Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z) - ABN: Anti-Blur Neural Networks for Multi-Stage Deformable Image
Registration [20.054872823030454]
変形可能な画像登録は、ニューロイメージングのための重要な前処理ステップとして機能する。
マルチステージ画像登録のための新しい解として,アンチブルネットワーク (ABN) を提案する。
論文 参考訳(メタデータ) (2022-12-06T19:21:43Z) - Unsupervised Misaligned Infrared and Visible Image Fusion via
Cross-Modality Image Generation and Registration [59.02821429555375]
我々は、教師なし不整合赤外線と可視画像融合のための頑健な相互モダリティ生成登録パラダイムを提案する。
登録された赤外線画像と可視画像とを融合させるため,IFM (Feature Interaction Fusion Module) を提案する。
論文 参考訳(メタデータ) (2022-05-24T07:51:57Z) - CoMIR: Contrastive Multimodal Image Representation for Registration [4.543268895439618]
我々は,CoMIR(Contrastive Multimodal Image Representations)と呼ばれる,共有された高密度画像表現を学習するためのコントラスト符号化を提案する。
CoMIRは、十分に類似した画像構造が欠如しているため、既存の登録方法がしばしば失敗するマルチモーダル画像の登録を可能にする。
論文 参考訳(メタデータ) (2020-06-11T10:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。