論文の概要: Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks
- arxiv url: http://arxiv.org/abs/2309.16499v2
- Date: Tue, 3 Oct 2023 08:49:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 07:14:57.811518
- Title: Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks
- Title(参考訳): クロスシティ問題:高分解能ドメイン適応ネットワークを用いたクロスシティセマンティクスセグメンテーションのためのマルチモーダルリモートセンシングベンチマークデータセット
- Authors: Danfeng Hong, Bing Zhang, Hao Li, Yuxuan Li, Jing Yao, Chenyu Li,
Martin Werner, Jocelyn Chanussot, Alexander Zipf, Xiao Xiang Zhu
- Abstract要約: 我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
- 参考スコア(独自算出の注目度): 82.82866901799565
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence (AI) approaches nowadays have gained remarkable
success in single-modality-dominated remote sensing (RS) applications,
especially with an emphasis on individual urban environments (e.g., single
cities or regions). Yet these AI models tend to meet the performance bottleneck
in the case studies across cities or regions, due to the lack of diverse RS
information and cutting-edge solutions with high generalization ability. To
this end, we build a new set of multimodal remote sensing benchmark datasets
(including hyperspectral, multispectral, SAR) for the study purpose of the
cross-city semantic segmentation task (called C2Seg dataset), which consists of
two cross-city scenes, i.e., Berlin-Augsburg (in Germany) and Beijing-Wuhan (in
China). Beyond the single city, we propose a high-resolution domain adaptation
network, HighDAN for short, to promote the AI model's generalization ability
from the multi-city environments. HighDAN is capable of retaining the spatially
topological structure of the studied urban scene well in a parallel high-to-low
resolution fusion fashion but also closing the gap derived from enormous
differences of RS image representations between different cities by means of
adversarial learning. In addition, the Dice loss is considered in HighDAN to
alleviate the class imbalance issue caused by factors across cities. Extensive
experiments conducted on the C2Seg dataset show the superiority of our HighDAN
in terms of segmentation performance and generalization ability, compared to
state-of-the-art competitors. The C2Seg dataset and the semantic segmentation
toolbox (involving the proposed HighDAN) will be available publicly at
https://github.com/danfenghong.
- Abstract(参考訳): 近年、人工知能(AI)のアプローチは、特に個々の都市環境(例えば、単一都市や地域)に重点を置いて、単一モダリティに支配されたリモートセンシング(RS)アプリケーションで顕著な成功を収めている。
しかし、これらのAIモデルは、多種多様なRS情報や高度な一般化能力を備えた最先端ソリューションが欠如しているため、都市や地域にわたるケーススタディにおけるパフォーマンスボトルネックを満たす傾向にある。
この目的のために我々は,ベルリン・アウクスブルク(ドイツ)と北京・武漢(中国)の2つの都市横断シーンからなる都市間セマンティックセグメンテーションタスク(C2Segデータセット)の研究を目的とした,マルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を新たに構築した。
一つの都市に留まらず,多都市環境からAIモデルの一般化能力を促進するために,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは、並列高分解能融合方式で研究都市景観の空間的トポロジカル構造を良好に維持できると同時に、異なる都市間でのRS画像表現の相違から生じるギャップを、対角学習により閉鎖することができる。
さらに、高DANでは、都市間の要因による階級不均衡の問題を軽減するため、Dice損失が考慮されている。
C2Segデータセットで実施された大規模な実験は、最先端の競合他社と比較して、セグメント化性能と一般化能力において、私たちのHighDANの優位性を示している。
C2Segデータセットとセマンティックセグメンテーションツールボックス(提案されているHighDANを含む)はhttps://github.com/danfenghong.comで公開される。
関連論文リスト
- Point Cloud Segmentation Using Transfer Learning with RandLA-Net: A Case
Study on Urban Areas [0.5242869847419834]
本稿では,都市部における大規模クラウドデータの3次元セグメンテーションのための最先端のニューラルネットワークアーキテクチャであるRandLA-Netの応用について述べる。
この研究は中国三大都市、Chengdu、Jiaoda、Shnzhenに焦点を当て、セグメンテーション性能を高めるためにその特徴を活用している。
論文 参考訳(メタデータ) (2023-12-19T06:13:58Z) - ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and
Multispectral Data Fusion [54.668445421149364]
HSI(Deep Learning-based Hyperspectral Image)は、HSI(Hyperspectral Image)とMSI(Multispectral Image)を深層ニューラルネットワーク(DNN)に融合させることにより、高空間分解能HSI(HR-HSI)を生成することを目的としている。
本稿では, HSI-MSI 融合のためのデータ多様性を向上するために, HSI-MSI サンプルペアの自動最適化と拡張を行う新しい逆自動データ拡張フレームワーク ADASR を提案する。
論文 参考訳(メタデータ) (2023-10-11T07:30:37Z) - General-Purpose Multimodal Transformer meets Remote Sensing Semantic
Segmentation [35.100738362291416]
マルチモーダルAIは、特にセマンティックセグメンテーションのような複雑なタスクのために、補完的なデータソースを活用する。
汎用マルチモーダルネットワークの最近のトレンドは、最先端の性能を達成する大きな可能性を示している。
本稿では,3次元畳み込みを利用して重要なローカル情報をエンコードし,同時にモーダルな特徴を学習するUNet型モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-07T04:58:34Z) - SARN: Structurally-Aware Recurrent Network for Spatio-Temporal Disaggregation [8.636014676778682]
オープンデータは、通常プライバシーポリシーに従うために、しばしば空間的に集約される。しかし、粗い、異質な集約は、下流のAI/MLシステムに対する一貫性のある学習と統合を複雑にする。
本稿では,空間的注意層をGRU(Gated Recurrent Unit)モデルに統合したSARN(Structurely-Aware Recurrent Network)を提案する。
履歴学習データに制限のあるシナリオでは、ある都市変数に事前学習したモデルを、数百のサンプルのみを用いて、他の都市変数に対して微調整できることを示す。
論文 参考訳(メタデータ) (2023-06-09T21:01:29Z) - Neural Embeddings of Urban Big Data Reveal Emergent Structures in Cities [7.148078723492643]
都市部の異質性を利用したニューラルネットワーク(GNN)を提案する。
アメリカ合衆国の16大都市圏において,何百万もの携帯電話利用者による大規模高解像度モビリティデータセットを用いて,都市部コンポーネント間の複雑な関係をエンコードしていることを示す。
異なる郡で訓練されたモデルによって生成された埋め込みは、他の郡における創発的空間構造の50%から60%を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-10-24T07:13:14Z) - Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT
Benchmark for Crowd Counting [109.32927895352685]
RGBT Crowd Counting (RGBT-CC) ベンチマークは2,030対のRGB熱画像と138,389人の注釈付き画像を含む。
マルチモーダルな群集カウントを容易にするために,クロスモーダルな協調表現学習フレームワークを提案する。
RGBT-CCベンチマークで行った実験は、RGBTの群集カウントにおけるフレームワークの有効性を示した。
論文 参考訳(メタデータ) (2020-12-08T16:18:29Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - Multi-level Feature Fusion-based CNN for Local Climate Zone
Classification from Sentinel-2 Images: Benchmark Results on the So2Sat LCZ42
Dataset [14.588626423336024]
この研究は、LCZ分類専用の大きなSo2Sat LCZ42ベンチマークデータセットに基づいている。
本稿では,Sen2LCZ-Net-MF を拡張した Sen2LCZ-Net-MF を用いて,CNN で Sentinel-2 画像から LCZ を分類する手法を提案する。
本研究は,LCZ分類と他の都市土地被覆土地利用分類の両分野において,今後のCNNベースのアルゴリズム開発のための重要なベースラインを提供する。
論文 参考訳(メタデータ) (2020-05-16T13:16:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。