論文の概要: HarmoniDiff-RS: Training-Free Diffusion Harmonization for Satellite Image Composition
- arxiv url: http://arxiv.org/abs/2604.19392v1
- Date: Tue, 21 Apr 2026 12:18:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.756987
- Title: HarmoniDiff-RS: Training-Free Diffusion Harmonization for Satellite Image Composition
- Title(参考訳): HarmoniDiff-RS:衛星画像合成のための訓練不要拡散調和
- Authors: Xiaoqi Zhuang, Jefersson A. Dos Santos, Jungong Han,
- Abstract要約: HarmoniDiff-RSは、複合衛星画像の調和のためのトレーニング不要拡散ベースのフレームワークである。
提案手法は,衛星画像合成を効果的に行い,スケーラブルなリモートセンシング合成とシミュレーションタスクの可能性を示す。
- 参考スコア(独自算出の注目度): 48.39960286051028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Satellite image composition plays a critical role in remote sensing applications such as data augmentation, disaste simulation, and urban planning. We propose HarmoniDiff-RS, a training-free diffusion-based framework for harmonizing composite satellite images under diverse domain conditions. Our method aligns the source and target domains through a Latent Mean Shift operation that transfers radiometric characteristics between them. To balance harmonization and content preservation, we introduce a Timestep-wise Latent Fusion strategy by leveraging early inverted latents for high harmonization and late latents for semantic consistency to generate a set of composite candidates. A lightweight harmony classifier is trained to further automatically select the most coherent result among them. We also construct RSIC-H, a benchmark dataset for satellite image harmonization derived from fMoW, providing 500 paired composition samples. Experiments demonstrate that our method effectively performs satellite image composition, showing strong potential for scalable remote-sensing synthesis and simulation tasks. Code is available at: https://github.com/XiaoqiZhuang/HarmoniDiff-RS.
- Abstract(参考訳): 衛星画像合成は,データ拡張,災害シミュレーション,都市計画などのリモートセンシングアプリケーションにおいて重要な役割を担っている。
本研究では,多様な領域条件下での複合衛星画像の調和のためのトレーニングフリー拡散ベースフレームワークであるHarmoniDiff-RSを提案する。
提案手法は, 放射能特性を伝達する遅延平均シフト演算により, ソース領域とターゲット領域を整列させる。
高調波化とコンテンツ保存のバランスをとるために, 初期反転潜水器を高調波化に, 潜水器を高調波化に利用し, セマンティック一貫性を保ち, 合成候補の集合を生成するタイムステップワイド潜水工法を導入する。
軽量な調和分類器を訓練し、それらのうち最も一貫性のある結果を自動的に選択する。
また、fMoWから得られた衛星画像調和のためのベンチマークデータセットであるRSIC-Hを構築し、500対の合成サンプルを提供する。
実験により,衛星画像合成を効果的に行い,スケーラブルなリモートセンシング合成とシミュレーションタスクの可能性を示した。
コードは、https://github.com/XiaoqiZhuang/HarmoniDiff-RS.comで入手できる。
関連論文リスト
- Region-to-Region: Enhancing Generative Image Harmonization with Adaptive Regional Injection [17.56045093665567]
画像調和の目標は、合成画像の前景を調整し、背景との視覚的整合性を実現することである。
近年, 遅延拡散モデル (LDM) が調和化に応用され, 顕著な結果が得られた。
現在の合成データセットは色移動に依存しており、局所的な変化がなく、複雑な現実世界の照明条件を捉えることができない。
論文 参考訳(メタデータ) (2025-08-13T12:21:51Z) - Quantitative Comparison of Fine-Tuning Techniques for Pretrained Latent Diffusion Models in the Generation of Unseen SAR Images [0.0]
我々は、SAR(Synthetic Aperture Radar)のモダリティに、オープンソースのテキスト・ツー・イメージ基盤モデルを適用する。
我々は,UNet拡散バックボーン,変分オートエンコーダ(VAE)およびテキストエンコーダの完全な微調整とパラメータ効率の低いローランド適応(LoRA)を比較した。
この結果から,テキストエンコーダと学習トークン埋め込みベストにLoRAを併用したハイブリッド戦略フルUNetチューニングが,SAR形状とテクスチャを保存できることが示唆された。
論文 参考訳(メタデータ) (2025-06-16T09:48:01Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - DiffHarmony: Latent Diffusion Model Meets Image Harmonization [11.500358677234939]
拡散モデルは画像から画像への翻訳タスクの迅速な開発を促進する。
スクラッチからの微調整事前学習潜伏拡散モデルは計算集約的である。
本稿では,事前学習した潜伏拡散モデルを画像調和タスクに適用し,調和性はあるが曖昧な初期画像を生成する。
論文 参考訳(メタデータ) (2024-04-09T09:05:23Z) - SatDM: Synthesizing Realistic Satellite Image with Semantic Layout
Conditioning using Diffusion Models [0.0]
Denoising Diffusion Probabilistic Models (DDPM) は意味的レイアウトから現実的なイメージを合成する上で大きな可能性を証明している。
本稿では,セマンティックマップを用いて高品質で多様な衛星画像を生成する条件付きDDPMモデルを提案する。
提案モデルの有効性は,本研究の文脈内で導入した詳細なラベル付きデータセットを用いて検証する。
論文 参考訳(メタデータ) (2023-09-28T19:39:13Z) - Deep Image Harmonization with Learnable Augmentation [17.690945824240348]
小型データセットの照明多様性を向上し、調和性能を向上させるため、学習可能な拡張法を提案する。
SycoNetは、フォアグラウンドマスクとランダムベクトルで実画像を取り込んで、適切な色変換を学習し、この実画像のフォアグラウンドに適用して合成合成合成画像を生成する。
論文 参考訳(メタデータ) (2023-08-01T08:40:23Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Image Harmonization with Region-wise Contrastive Learning [51.309905690367835]
本稿では,外部スタイルの融合と領域単位のコントラスト学習方式を備えた新しい画像調和フレームワークを提案する。
提案手法は, 前景と背景の相互情報を最大化することにより, 対応する正と負のサンプルをまとめることを試みる。
論文 参考訳(メタデータ) (2022-05-27T15:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。