論文の概要: Multimodal Learning for detecting urban functional zones using remote
sensing image and multi-semantic information
- arxiv url: http://arxiv.org/abs/2401.06550v1
- Date: Fri, 12 Jan 2024 12:54:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 19:35:14.574517
- Title: Multimodal Learning for detecting urban functional zones using remote
sensing image and multi-semantic information
- Title(参考訳): リモートセンシング画像とマルチセマンティクス情報を用いた都市機能領域検出のためのマルチモーダル学習
- Authors: Chuanji Shi, Yingying Zhang, Jiaotuan Wang and Qiqi Zhu
- Abstract要約: アーバン・エリア・オブ・関心(アーバン・エリア・オブ・エンターテイメント、Urban Area-of-interest、AOI)とは、境界が定義された都市機能ゾーンをいう。
本稿では,AOIフェンス多角形検出のためのエンドツーエンドマルチモーダルディープラーニングアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 8.886769068844155
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Urban area-of-interest (AOI) refers to an integrated urban functional zone
with defined boundaries. The rapid development of urban commerce has resulted
in an increased demand for more precise requirements in defining AOIs. However,
existing research primarily concentrates on broad AOI mining for urban planning
or regional economic analysis, failing to cater to the precise requirements of
mobile Internet online-to-offline businesses. These businesses necessitate
accuracy down to a specific community, school, or hospital. In this paper, we
propose an end-to-end multimodal deep learning algorithm for detecting AOI
fence polygon using remote sensing images and multi-semantics reference
information. We then evaluate its timeliness through a cascaded module that
incorporates dynamic human mobility and logistics address information.
Specifically, we begin by selecting a point-of-interest (POI) of specific
category, and use it to recall corresponding remote sensing images, nearby
POIs, road nodes, human mobility, and logistics addresses to build a multimodal
detection model based on transformer encoder-decoder architecture, titled
AOITR. In the model, in addition to the remote sensing images, multi-semantic
information including core POI and road nodes is embedded and reorganized as
the query content part for the transformer decoder to generate the AOI polygon.
Meanwhile, relatively dynamic distribution features of human mobility, nearby
POIs, and logistics addresses are used for AOI reliability evaluation through a
cascaded feedforward network. The experimental results demonstrate that our
algorithm significantly outperforms two existing methods.
- Abstract(参考訳): アーバン・エリア・オブ・インタレスト(urban area-of-interest、aoi)は、定義された境界を持つ統合的な都市機能ゾーンである。
都市商業の急速な発展により、AOIを定義するためのより正確な要件に対する需要が高まっている。
しかし、既存の研究は主に都市計画や地域経済分析のための広いAOI鉱業に集中しており、モバイルインターネット・オンライン・オフラインビジネスの正確な要求に応えていない。
これらのビジネスは、特定のコミュニティ、学校、病院まで正確さを必要とする。
本稿では、リモートセンシング画像とマルチセマンティック参照情報を用いて、AOIフェンスポリゴンを検出するエンドツーエンドのマルチモーダルディープラーニングアルゴリズムを提案する。
次に、動的な人体移動と物流アドレス情報を含むカスケードモジュールを用いて、そのタイムラインを評価する。
具体的には、特定のカテゴリのポイント・オブ・関心(POI)を選択して、それを使って対応するリモートセンシング画像、近くのPOI、道路ノード、人間の移動性、物流アドレスをリコールし、トランスフォーマーエンコーダ・デコーダアーキテクチャ(AOITR)に基づくマルチモーダル検出モデルを構築する。
このモデルでは、リモートセンシング画像に加えて、コアPOIとロードノードを含むマルチセマンティック情報を、トランスフォーマーデコーダのクエリコンテンツ部として埋め込み再編成し、AOIポリゴンを生成する。
一方,人間の移動性,近傍pois,ロジスティクスアドレスの比較的ダイナミックな分布特性は,逐次的なフィードフォワードネットワークによるaoi信頼性評価に用いられる。
実験の結果,本アルゴリズムは既存の2つの手法を大きく上回ることがわかった。
関連論文リスト
- GOMAA-Geo: GOal Modality Agnostic Active Geo-localization [49.599465495973654]
エージェントが空中ナビゲーション中に観測された一連の視覚的手がかりを用いて、複数の可能なモダリティによって特定されたターゲットを見つけるという、アクティブなジオローカライゼーション(AGL)の課題を考察する。
GOMAA-Geo は、ゴールモダリティ間のゼロショット一般化のためのゴールモダリティアクティブなジオローカライゼーションエージェントである。
論文 参考訳(メタデータ) (2024-06-04T02:59:36Z) - Translating Images to Road Network: A Sequence-to-Sequence Perspective [32.39335559663393]
道路網は高精細地図の生成に不可欠である。
既存のメソッドは、2つのタイプのデータドメインを効果的にマージするのに苦労しています。
我々は、ユークリッドデータと非ユークリッドデータの両方をRoadNet Sequenceと呼ばれる整数列に投影することで、両方のデータ領域の統一表現を提案する。
論文 参考訳(メタデータ) (2024-02-13T04:12:41Z) - Leveraging Topology for Domain Adaptive Road Segmentation in Satellite
and Aerial Imagery [9.23555285827483]
道路分割アルゴリズムは、新しい地理的位置への一般化に失敗する。
道路骨格は、トポロジカルな制約を課す補助的なタスクである。
自己学習のために、接続性に基づく擬似ラベル改善戦略を用いて、ノイズの多い擬似ラベルをフィルタリングする。
論文 参考訳(メタデータ) (2023-09-27T12:50:51Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - Adaptive Hierarchical SpatioTemporal Network for Traffic Forecasting [70.66710698485745]
本稿では,AHSTN(Adaptive Hierarchical SpatioTemporal Network)を提案する。
AHSTNは空間階層を利用し、マルチスケール空間相関をモデル化する。
2つの実世界のデータセットの実験により、AHSTNはいくつかの強いベースラインよりも優れたパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-06-15T14:50:27Z) - Semi-supervised Road Updating Network (SRUNet): A Deep Learning Method
for Road Updating from Remote Sensing Imagery and Historical Vector Maps [3.350048575501172]
本研究では,道路更新のための半教師付き学習(SRUNet)に基づく道路検出手法を提案する。
提案したSRUNetは,幅広い道路更新作業に対して,安定かつ最新かつ信頼性の高い予測結果を提供する。
論文 参考訳(メタデータ) (2023-04-28T16:51:35Z) - UDTIRI: An Online Open-Source Intelligent Road Inspection Benchmark
Suite [21.565438268381467]
このベンチマークスイートで公開された最初のオンラインコンペである道路穴検出タスクを紹介します。
我々のベンチマークは、最先端のオブジェクト検出、セマンティックセグメンテーション、インスタンスセグメンテーションネットワークの体系的かつ徹底的な評価を提供する。
多様な道路条件をより包括的に理解したアルゴリズムを提供することで、未解決の可能性を解き明かそうとしている。
論文 参考訳(メタデータ) (2023-04-18T09:13:52Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z) - Traffic Flow Forecasting with Spatial-Temporal Graph Diffusion Network [39.65520262751766]
我々は新しい交通予測フレームワーク-時空間グラフ拡散ネットワーク(ST-GDN)を開発した。
特にST-GDNは階層的に構造化されたグラフニューラルネットワークアーキテクチャであり、局所的な地域的な地理的依存関係だけでなく、グローバルな視点から空間的意味論も学習する。
複数の実生活トラフィックデータセットの実験では、ST-GDNは最先端のベースラインの異なるタイプよりも優れていることが示されている。
論文 参考訳(メタデータ) (2021-10-08T11:19:06Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。