論文の概要: ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis
- arxiv url: http://arxiv.org/abs/2409.17049v1
- Date: Wed, 25 Sep 2024 16:03:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-27 03:04:59.644210
- Title: ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis
- Title(参考訳): ControlCity: 正確な地理空間データ生成と都市形態解析のためのマルチモーダル拡散モデルに基づくアプローチ
- Authors: Fangshuo Zhou, Huaxia Li, Rui Hu, Sensen Wu, Hailin Feng, Zhenhong Du, Liuchang Xu,
- Abstract要約: 本稿では,アクセス可能なVGIデータと完全なVGIデータを利用して,都市建物のフットプリントデータの生成を支援するマルチソース地理データ変換ソリューションを提案する。
次に,多モード拡散モデルに基づく地理データ変換手法であるControlCityを提案する。
世界の22都市での実験では、ControlCityが実際の都市建築パターンをシミュレートすることに成功している。
- 参考スコア(独自算出の注目度): 6.600555803960957
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Volunteer Geographic Information (VGI), with its rich variety, large volume, rapid updates, and diverse sources, has become a critical source of geospatial data. However, VGI data from platforms like OSM exhibit significant quality heterogeneity across different data types, particularly with urban building data. To address this, we propose a multi-source geographic data transformation solution, utilizing accessible and complete VGI data to assist in generating urban building footprint data. We also employ a multimodal data generation framework to improve accuracy. First, we introduce a pipeline for constructing an 'image-text-metadata-building footprint' dataset, primarily based on road network data and supplemented by other multimodal data. We then present ControlCity, a geographic data transformation method based on a multimodal diffusion model. This method first uses a pre-trained text-to-image model to align text, metadata, and building footprint data. An improved ControlNet further integrates road network and land-use imagery, producing refined building footprint data. Experiments across 22 global cities demonstrate that ControlCity successfully simulates real urban building patterns, achieving state-of-the-art performance. Specifically, our method achieves an average FID score of 50.94, reducing error by 71.01% compared to leading methods, and a MIoU score of 0.36, an improvement of 38.46%. Additionally, our model excels in tasks like urban morphology transfer, zero-shot city generation, and spatial data completeness assessment. In the zero-shot city task, our method accurately predicts and generates similar urban structures, demonstrating strong generalization. This study confirms the effectiveness of our approach in generating urban building footprint data and capturing complex city characteristics.
- Abstract(参考訳): VGI(Volunteer Geographic Information)は、多種多様で、多種多様で、急激な更新、多種多様で、地理空間データの重要な情報源となっている。
しかし、OSMのようなプラットフォームからのVGIデータは、特に都市ビルディングデータにおいて、異なるデータタイプ間で大きな品質の不均一性を示す。
そこで本稿では,アクセス可能かつ完全なVGIデータを利用した多元的地理データ変換手法を提案する。
精度を向上させるためにマルチモーダルデータ生成フレームワークも使用しています。
まず、道路網のデータに基づいて、他のマルチモーダルデータによって補完された「画像テキスト・メタデータ構築フットプリント」データセットを構築するパイプラインを導入する。
次に,多モード拡散モデルに基づく地理データ変換手法であるControlCityを提案する。
この方法はまず、トレーニング済みのテキスト・ツー・イメージモデルを使用して、テキスト、メタデータ、フットプリントデータのアライメントを行う。
改良されたControlNetは、道路網と土地利用画像を統合し、洗練された建物のフットプリントデータを生成する。
世界の22都市での実験では、ControlCityは実際の都市建築パターンをシミュレートし、最先端のパフォーマンスを実現している。
具体的には, 平均FIDスコアが50.94, 誤差が71.01%, MIoUスコアが0.36, 改善率が38.46%である。
さらに, 都市形態素移動, ゼロショット都市生成, 空間データ完全性評価などのタスクに優れる。
ゼロショット都市課題では, 都市構造を正確に予測し, 生成し, 強力な一般化を示す。
本研究は,都市建築のフットプリントデータの生成と複雑な都市特性の把握におけるアプローチの有効性を検証した。
関連論文リスト
- Personalized Federated Learning via Active Sampling [50.456464838807115]
本稿では,類似した(あるいは関連する)データジェネレータを逐次同定する手法を提案する。
本手法は,局所的なデータセットを用いて勾配ステップの効果を評価することにより,データ生成の関連性を評価する。
データ生成器が提供する局所的データセットを用いて仮説を更新するために、勾配ステップの適切な一般化により、この手法を非パラメトリックモデルに拡張する。
論文 参考訳(メタデータ) (2024-09-03T17:12:21Z) - RoBus: A Multimodal Dataset for Controllable Road Networks and Building Layouts Generation [4.322143509436427]
ロードネットワークとビルディングレイアウト(RoBus)の制御可能な生成のための評価指標を備えたマルチモーダルデータセットを導入する。
RoBusは、これまでのところ、都市世代で最初の、そして最大のオープンソースデータセットだ。
我々は,RoBusデータセットを統計的に分析し,既存の道路網と建築レイアウト生成手法の有効性を検証した。
道路ネットワークや建物レイアウトの生成プロセスにおいて,道路配向や建物密度などの都市特性を取り入れた新しいベースラインを設計する。
論文 参考訳(メタデータ) (2024-07-10T16:55:01Z) - Identifying every building's function in large-scale urban areas with multi-modality remote-sensing data [5.18540804614798]
本研究は,大規模都市部における建物機能同定のための半教師付き枠組みを提案する。
光画像、建築高さ、夜間光データを収集し、建物の形態特性を記述する。
結果は、政府による2万の検証ポイントと統計調査によって評価される。
論文 参考訳(メタデータ) (2024-05-08T15:32:20Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - City Foundation Models for Learning General Purpose Representations from
OpenStreetMap [17.577683270277173]
本稿では,都市のような選択された地理的関心領域における基礎モデルをトレーニングするためのフレームワークであるCityFMを紹介する。
CityFMはOpenStreetMapからのオープンデータにのみ依存し、異なるタイプのエンティティ、空間、視覚、およびテキスト情報のマルチモーダル表現を生成する。
すべての実験において、CityFMはベースラインに匹敵する、あるいは同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-10-01T05:55:30Z) - Unified Data Management and Comprehensive Performance Evaluation for
Urban Spatial-Temporal Prediction [Experiment, Analysis & Benchmark] [78.05103666987655]
この研究は、多様な都市空間時間データセットにアクセスし活用する際の課題に対処する。
都市空間・時空間のビッグデータ用に設計された統合ストレージフォーマットであるアトミックファイルを導入し,40種類の多様なデータセットでその有効性を検証する。
多様なモデルとデータセットを使用して広範な実験を行い、パフォーマンスリーダーボードを確立し、有望な研究方向性を特定する。
論文 参考訳(メタデータ) (2023-08-24T16:20:00Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - Spatio-Temporal Graph Few-Shot Learning with Cross-City Knowledge
Transfer [58.6106391721944]
クロスシティの知識は、データ不足の都市から学んだモデルを活用して、データ不足の都市の学習プロセスに役立てるという、その将来性を示している。
本稿では,ST-GFSLと呼ばれるS時間グラフのためのモデルに依存しない数ショット学習フレームワークを提案する。
本研究では,4つの交通速度予測ベンチマークの総合的な実験を行い,ST-GFSLの有効性を最先端手法と比較した。
論文 参考訳(メタデータ) (2022-05-27T12:46:52Z) - GANmapper: geographical content filling [0.0]
本稿では,GAN(Generative Adversarial Network)を用いた空間データ生成手法を提案する。
当社のコントリビューションでは、粗大で広く利用可能な地理空間データを使用して、構築された環境のより細かいスケールで、あまり利用できない機能のマップを作成しています。
我々は、土地利用データと道路ネットワークを入力として、建物のフットプリントを生成し、世界中の9都市で実験を行う。
論文 参考訳(メタデータ) (2021-08-07T05:50:54Z) - CityNet: A Comprehensive Multi-Modal Urban Dataset for Advanced Research in Urban Computing [1.9774168196078137]
我々は,7つの都市からのさまざまなデータを組み込んだマルチモーダル都市データセットであるCityNetを紹介する。
我々はCityNetの利用を促進するために、広範なデータマイニングと機械学習の実験を行っている。
論文 参考訳(メタデータ) (2021-06-30T04:05:51Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。