論文の概要: D2-CDIG: Controlled Diffusion Remote Sensing Image Generation with Dual Priors of DEM and Cloud-Fog
- arxiv url: http://arxiv.org/abs/2605.14326v1
- Date: Thu, 14 May 2026 03:41:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.607399
- Title: D2-CDIG: Controlled Diffusion Remote Sensing Image Generation with Dual Priors of DEM and Cloud-Fog
- Title(参考訳): D2-CDIG:DEMとクラウドフォッグの二重優先による拡散リモートセンシング画像生成制御
- Authors: Zuopeng Zhao, Ying Liu, Kanyaphakphachsorn Pharksuwan, Su Luo, Xiaoyu Li, Maocai Ning,
- Abstract要約: 本稿では,拡散モデルとデュアルプライア制御機構を統合した新しいリモートセンシング画像生成フレームワークD2-CDIGを提案する。
D2-CDIGは、生成された画像内の地面の特徴と大気現象を正確に制御する。
セグメンテーションやエッジ検出に基づく従来の手法と比較して、D2-CDIGは画質、ディテールリッチネス、リアリズムを著しく改善した。
- 参考スコア(独自算出の注目度): 5.522713489608133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote sensing image generation provides a reliable data foundation for remote sensing large models and downstream tasks. However, existing controllable remote sensing image generation methods typically rely on traditional techniques such as segmentation and edge detection, which do not fully leverage terrain or atmospheric conditions. As a result, the generated images often lack accuracy and naturalness when dealing with complex terrains and atmospheric phenomena. In this paper, we propose a novel remote sensing image generation framework, D2-CDIG, which integrates diffusion models with a dual-prior control mechanism. By incorporating both Digital Elevation Model (DEM) and cloud-fog information as dual prior knowledge, D2-CDIG precisely controls ground features and atmospheric phenomena within the generated images. Specifically, D2-CDIG decouples the terrain and atmospheric generation processes through independent control of ground and atmospheric branches. Additionally, a refined cloud-fog slider is introduced to flexibly adjust cloud thickness and distribution. During training, ground and atmospheric control signals are injected in layers to ensure a seamless transition within the images. Compared to traditional methods based on segmentation or edge detection, D2-CDIG shows significant improvements in image quality, detail richness, and realism. D2-CDIG offers a flexible and precise solution for remote sensing image generation, providing high-quality data for training large remote sensing models and downstream tasks.
- Abstract(参考訳): リモートセンシング画像生成は、リモートセンシング大モデルと下流タスクのための信頼性の高いデータ基盤を提供する。
しかし、既存の制御可能なリモートセンシング画像生成法は、通常、地形や大気条件を完全に活用しないセグメンテーションやエッジ検出といった従来の技術に依存している。
その結果、生成された画像は複雑な地形や大気現象を扱う際に、正確さと自然性に欠けることが多い。
本稿では,D2-CDIGとD2-CDIGを併用したリモートセンシング画像生成フレームワークを提案する。
D2-CDIGは、DEM(Digital Elevation Model)とクラウドフォッグ情報の両方を二重の事前知識として組み込むことで、生成された画像内の地面の特徴や大気現象を正確に制御する。
具体的には、D2-CDIGは地上と大気の枝を独立に制御することで、地形と大気の生成プロセスを分離する。
また、雲の厚さと分布を柔軟に調整する改良された雲霧スライダが導入された。
トレーニング中、地上と大気の制御信号が層に注入され、画像内のシームレスな遷移が保証される。
セグメンテーションやエッジ検出に基づく従来の手法と比較して、D2-CDIGは画質、ディテールリッチネス、リアリズムを著しく改善した。
D2-CDIGは、リモートセンシング画像生成のための柔軟で正確なソリューションを提供し、大規模なリモートセンシングモデルと下流タスクをトレーニングするための高品質なデータを提供する。
関連論文リスト
- UDPNet: Unleashing Depth-based Priors for Robust Image Dehazing [77.10640210751981]
UDPNetは、大規模で事前訓練された深度推定モデルDepthAnything V2から深度に基づく事前情報を活用する一般的なフレームワークである。
提案手法は,様々なシナリオにまたがる深度認識デハージングのための新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2026-01-11T13:29:02Z) - Object Fidelity Diffusion for Remote Sensing Image Generation [7.171597875550511]
本稿では,リモートセンシングにおけるオブジェクトの精度と忠実度を高めるために,オブジェクトの忠実度拡散(OF-Diff)を提案する。
我々は、リモートセンシングにおける拡散モデルのためのレイアウトに基づいて、オブジェクトの以前の形状を初めて抽出する。
また、DDPOを導入して拡散過程を微調整し、生成したリモートセンシング画像をより多様でセマンティックに一貫性を持たせる。
論文 参考訳(メタデータ) (2025-08-14T16:24:11Z) - A Diffusion-Based Framework for Terrain-Aware Remote Sensing Image Reconstruction [4.824120664293887]
SatelliteMakerは、さまざまなレベルのデータ損失で失われたデータを再構成する拡散ベースの方法である。
条件入力としてのDEM(Digital Elevation Model)は、リアルな画像を生成するために調整されたプロンプトを使用する。
分散損失に基づくVGG-Adapterモジュール。
論文 参考訳(メタデータ) (2025-04-16T14:19:57Z) - Talk2PC: Enhancing 3D Visual Grounding through LiDAR and Radar Point Clouds Fusion for Autonomous Driving [39.60518561679198]
我々は,プロンプト誘導点雲センサの組み合わせのパラダイムに基づく,最初の屋外3次元視覚グラウンドモデルであるTPCNetを提案する。
実験により、TPCNetはTalk2RadarとTalk2Carの両方のデータセット上で最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-03-11T11:48:27Z) - GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data
Generation [91.01581867841894]
様々な幾何学的条件をテキストプロンプトに柔軟に翻訳できるシンプルなフレームワークであるGeoDiffusionを提案する。
われわれのGeoDiffusionは、バウンディングボックスだけでなく、自動運転シーンのカメラビューのような余分な幾何学的条件もエンコードできる。
論文 参考訳(メタデータ) (2023-06-07T17:17:58Z) - HRFuser: A Multi-resolution Sensor Fusion Architecture for 2D Object
Detection [0.0]
マルチモーダル2Dオブジェクト検出のためのモジュールアーキテクチャであるHRFuserを提案する。
マルチレゾリューション方式で複数のセンサーを融合させ、任意の数の入力モードにスケールする。
我々は、nuScenesとDENSEデータセットに関する実験を通じて、我々のモデルが追加のモーダルから補完的な特徴を効果的に活用できることを実証する。
論文 参考訳(メタデータ) (2022-06-30T09:40:05Z) - TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with
Transformers [49.689566246504356]
そこで本研究では,LiDAR-カメラ融合に対するソフトアソシエーション機構による堅牢な解であるTransFusionを提案する。
TransFusionは大規模データセット上で最先端のパフォーマンスを実現する。
提案手法を3次元トラッキングタスクに拡張し,nuScenesトラッキングのリーダーボードにおける第1位を達成する。
論文 参考訳(メタデータ) (2022-03-22T07:15:13Z) - D2C: Diffusion-Denoising Models for Few-shot Conditional Generation [109.68228014811443]
コントラスト表現を用いた拡散復号モデル(D2C)について述べる。
D2Cは、学習した拡散に基づく遅延表現を用いて、表現品質を改善するために、生成と対照的な自己教師付き学習を改善する。
条件付き画像操作では、D2C世代はStyleGAN2世代よりも2桁早く生成でき、二重盲検でヒト評価者の50%から60%が好んでいる。
論文 参考訳(メタデータ) (2021-06-12T16:32:30Z) - Unlimited Resolution Image Generation with R2D2-GANs [69.90258455164513]
本稿では,任意の解像度の高品質な画像を生成するための新しいシミュレーション手法を提案する。
この方法では、フル長のミッション中に収集したソナースキャンと同等の大きさのソナースキャンを合成することができる。
生成されたデータは、連続的で、現実的に見え、また、取得の実際の速度の少なくとも2倍の速さで生成される。
論文 参考訳(メタデータ) (2020-03-02T17:49:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。