論文の概要: C2GM: Cascading Conditional Generation of Multi-scale Maps from Remote Sensing Images Constrained by Geographic Features
- arxiv url: http://arxiv.org/abs/2502.04991v1
- Date: Fri, 07 Feb 2025 15:11:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:55:47.991950
- Title: C2GM: Cascading Conditional Generation of Multi-scale Maps from Remote Sensing Images Constrained by Geographic Features
- Title(参考訳): C2GM:地理的特徴によるリモートセンシング画像からのマルチスケールマップのカスケード条件生成
- Authors: Chenxing Sun, Yongyang Xu, Xuwei Xu, Xixi Fan, Jing Bai, Xiechun Lu, Zhanlong Chen,
- Abstract要約: 本稿では,リモートセンシング画像からマルチスケールタイルマップを生成する新しいフレームワークであるC2GMを提案する。
リモートセンシング画像とカスケード参照二重分岐入力からオブジェクトの事前情報を抽出する条件付き特徴フュージョンエンコーダを実装した。
C2GMは、すべてのメトリクスにおける最先端(SOTA)のパフォーマンスを一貫して達成する。
- 参考スコア(独自算出の注目度): 2.414525855161937
- License:
- Abstract: Multi-scale maps are essential representations of surveying and cartographic results, serving as fundamental components of geographic services. Current image generation networks can quickly produce map tiles from remote-sensing images. However, generative models designed for natural images often focus on texture features, neglecting the unique characteristics of remote-sensing features and the scale attributes of tile maps. This limitation in generative models impairs the accurate representation of geographic information, and the quality of tile map generation still needs improvement. Diffusion models have demonstrated remarkable success in various image generation tasks, highlighting their potential to address this challenge. This paper presents C2GM, a novel framework for generating multi-scale tile maps through conditional guided diffusion and multi-scale cascade generation. Specifically, we implement a conditional feature fusion encoder to extract object priors from remote sensing images and cascade reference double branch input, ensuring an accurate representation of complex features. Low-level generated tiles act as constraints for high-level map generation, enhancing visual continuity. Moreover, we incorporate map scale modality information using CLIP to simulate the relationship between map scale and cartographic generalization in tile maps. Extensive experimental evaluations demonstrate that C2GM consistently achieves the state-of-the-art (SOTA) performance on all metrics, facilitating the rapid and effective generation of multi-scale large-format maps for emergency response and remote mapping applications.
- Abstract(参考訳): マルチスケール地図は測量や地図作成に欠かせないものであり、地理的サービスの基本的構成要素となっている。
現在の画像生成ネットワークは、リモートセンシング画像から地図タイルを迅速に生成できる。
しかし、自然画像用に設計された生成モデルは、しばしばテクスチャの特徴に焦点を合わせ、リモートセンシングの特徴やタイルマップのスケール特性を無視する。
生成モデルにおけるこの制限は地理的情報の正確な表現を損なうものであり、タイルマップ生成の品質は依然として改善が必要である。
拡散モデルは様々な画像生成タスクにおいて顕著な成功を収めており、この課題に対処する可能性を強調している。
本稿では,条件付き誘導拡散とマルチスケールカスケード生成によるマルチスケールタイルマップ生成のための新しいフレームワークであるC2GMを提案する。
具体的には、リモートセンシング画像とカスケード参照二重分岐入力からオブジェクトを抽出する条件付き特徴融合エンコーダを実装し、複雑な特徴の正確な表現を保証する。
低レベル生成タイルは高レベルマップ生成の制約として機能し、視覚的連続性を高める。
さらに,CLIPを用いて地図スケールのモダリティ情報を組み込んで,地図スケールとタイルマップの地図一般化の関係をシミュレートする。
広範囲な実験的評価により、C2GMはあらゆる指標で常に最先端(SOTA)の性能を達成し、緊急対応や遠隔マッピングへの応用のために、高速かつ効果的に大規模地図を作成できることが示されている。
関連論文リスト
- Panoptic Diffusion Models: co-generation of images and segmentation maps [7.573297026523597]
本稿では,PDM(Panoptic Diffusion Model)を提案する。
PDMは画像とテキストのギャップを埋めるために、生成プロセス全体を通して詳細なビルトインガイダンスを提供するセグメンテーションレイアウトを構築する。
論文 参考訳(メタデータ) (2024-12-04T00:42:15Z) - MGMapNet: Multi-Granularity Representation Learning for End-to-End Vectorized HD Map Construction [75.93907511203317]
多粒性表現を持つ地図要素をモデル化するためのMGMapNet(Multi-Granularity Map Network)を提案する。
提案したMGMapNetは最先端のパフォーマンスを達成し,MapTRv2 を nuScenes で 5.3 mAP,Argoverse2 で 4.4 mAP で上回った。
論文 参考訳(メタデータ) (2024-10-10T09:05:23Z) - HPix: Generating Vector Maps from Satellite Images [0.0]
衛星画像からベクトルタイルマップを生成するためにGAN(Generative Adversarial Networks)を改良したHPixと呼ばれる新しい手法を提案する。
経験的評価を通じて,提案手法は高精度かつ視覚的に表現可能なベクトルタイルマップを作成する上での有効性を示す。
さらに、道路交差点のマッピングや、その面積に基づいたフットプリントクラスタの構築など、我々の研究の応用を拡大する。
論文 参考訳(メタデータ) (2024-07-18T16:54:02Z) - DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model [15.803614800117781]
DiffMapは,マップセグメンテーションマスクの構造をモデル化する新しい手法である。
この手法を取り入れることで,既存のセマンティックセグメンテーション手法の性能を大幅に向上させることができる。
本モデルは,実世界の地図レイアウトをより正確に反映した結果を生成する上で,優れた習熟度を示す。
論文 参考訳(メタデータ) (2024-05-03T11:16:27Z) - SSMG: Spatial-Semantic Map Guided Diffusion Model for Free-form
Layout-to-Image Generation [68.42476385214785]
本稿では,レイアウトから派生した特徴写像を用いた空間意味マップガイド(SSMG)拡散モデルを提案する。
SSMGは,従来の研究に比べて空間的,意味的な制御性に優れた生成品質を実現する。
また,RSA(Relation-Sensitive Attention)機構とLSA(Location-Sensitive Attention)機構を提案する。
論文 参考訳(メタデータ) (2023-08-20T04:09:12Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Cross-Descriptor Visual Localization and Mapping [81.16435356103133]
視覚のローカライゼーションとマッピングは、Mixed Realityとロボティクスシステムの大部分を支える重要な技術である。
特徴表現の連続的な更新を必要とする局所化とマッピングのための3つの新しいシナリオを提案する。
我々のデータ駆動型アプローチは特徴記述子型に非依存であり、計算要求が低く、記述アルゴリズムの数と線形にスケールする。
論文 参考訳(メタデータ) (2020-12-02T18:19:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。