論文の概要: A Modality-Tailored Graph Modeling Framework for Urban Region Representation via Contrastive Learning
- arxiv url: http://arxiv.org/abs/2509.23772v1
- Date: Sun, 28 Sep 2025 09:38:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.438056
- Title: A Modality-Tailored Graph Modeling Framework for Urban Region Representation via Contrastive Learning
- Title(参考訳): コントラスト学習による都市域表現のためのモダリティ階層グラフモデリングフレームワーク
- Authors: Yaya Zhao, Kaiqi Zhao, Zixuan Tang, Zhiyuan Liu, Xiaoling Lu, Yalei Du,
- Abstract要約: 都市域表現のためのモダリティ調整グラフモデリングフレームワークMTGRRを提案する。
集約レベルのモダリティに対して、MTGRRは、各モダリティを専用の専門家GNNによって処理する、Mix-of-expertsグラフアーキテクチャを採用している。
点レベルのモダリティのために、双対レベルのGNNを構築して、きめ細かい視覚的意味的特徴を抽出する。
- 参考スコア(独自算出の注目度): 22.865789467134544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph-based models have emerged as a powerful paradigm for modeling multimodal urban data and learning region representations for various downstream tasks. However, existing approaches face two major limitations. (1) They typically employ identical graph neural network architectures across all modalities, failing to capture modality-specific structures and characteristics. (2) During the fusion stage, they often neglect spatial heterogeneity by assuming that the aggregation weights of different modalities remain invariant across regions, resulting in suboptimal representations. To address these issues, we propose MTGRR, a modality-tailored graph modeling framework for urban region representation, built upon a multimodal dataset comprising point of interest (POI), taxi mobility, land use, road element, remote sensing, and street view images. (1) MTGRR categorizes modalities into two groups based on spatial density and data characteristics: aggregated-level and point-level modalities. For aggregated-level modalities, MTGRR employs a mixture-of-experts (MoE) graph architecture, where each modality is processed by a dedicated expert GNN to capture distinct modality-specific characteristics. For the point-level modality, a dual-level GNN is constructed to extract fine-grained visual semantic features. (2) To obtain effective region representations under spatial heterogeneity, a spatially-aware multimodal fusion mechanism is designed to dynamically infer region-specific modality fusion weights. Building on this graph modeling framework, MTGRR further employs a joint contrastive learning strategy that integrates region aggregated-level, point-level, and fusion-level objectives to optimize region representations. Experiments on two real-world datasets across six modalities and three tasks demonstrate that MTGRR consistently outperforms state-of-the-art baselines, validating its effectiveness.
- Abstract(参考訳): グラフベースのモデルは、様々な下流タスクのためのマルチモーダル都市データのモデリングと学習領域表現のための強力なパラダイムとして登場した。
しかし、既存のアプローチには2つの大きな制限がある。
1) 典型的には、すべてのモダリティにまたがる同一のグラフニューラルネットワークアーキテクチャを使用し、モダリティ固有の構造や特性を捉えることができない。
2) 融合段階において, 異なるモダリティの凝集重みが領域間で不変であることから, 空間的不均一性を無視することがしばしばある。
これらの課題に対処するため, MTGRR は, 関心点(POI), タクシー移動量, 土地利用量, 道路要素, リモートセンシング, ストリートビュー画像からなるマルチモーダルデータセット上に構築されている。
1)MTGRRは,空間密度とデータ特性,集約レベルと点レベルという2つのグループに分類する。
集約レベルのモダリティに対しては、MTGRRはMix-of-experts (MoE)グラフアーキテクチャを使用し、各モダリティは専用の専門家GNNによって処理され、異なるモダリティ固有の特性をキャプチャする。
点レベルのモダリティのために、双対レベルのGNNを構築して、きめ細かい視覚的意味的特徴を抽出する。
2) 空間的不均一性の下で有効な領域表現を得るために, 空間的に認識可能な多モード融合機構を設計し, 領域固有のモード融合重みを動的に推定する。
このグラフモデリングフレームワークに基づいて、MTGRRはさらに、領域の集約レベル、ポイントレベル、融合レベルの目的を統合して、領域の表現を最適化する、共同コントラスト学習戦略を採用している。
6つのモードと3つのタスクにわたる2つの実世界のデータセットの実験は、MTGRRが一貫して最先端のベースラインを上回り、その有効性を検証していることを示している。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - AdaptGOT: A Pre-trained Model for Adaptive Contextual POI Representation Learning [7.277204616781735]
本稿では,Adaptive表現学習技術とGeographical-Co-Occurrence-Text表現を統合したAdaptGOTモデルを提案する。
アダプGOTモデルは、(1)KNN、密度ベース、重要度ベース、カテゴリー認識といった高度な混合サンプリング手法を統合して複雑なコンテキスト近傍を捕捉するコンテキスト近傍生成、(2)高品質でカスタマイズされた表現を導出し、POI間の複雑な相互関係を効率的に捉えるように設計された注意機構によって強化された高度なGOT表現、(3)位相整合性を保証するMoEベースの適応エンコーダ・デコーダアーキテクチャ、の3つの主要な構成要素から構成される。
論文 参考訳(メタデータ) (2025-06-21T08:06:06Z) - A Unified Framework for Next-Gen Urban Forecasting via LLM-driven Dependency Retrieval and GeoTransformer [7.128763419599272]
本研究では,高次元都市予測のための新しい統一的枠組みを提案する。
我々のフレームワークはモジュール化されており、多様な表現方法や予測モデルをサポートし、最小限の入力でも操作できる。
論文 参考訳(メタデータ) (2024-08-16T17:26:42Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - Attentive Graph Enhanced Region Representation Learning [7.4106801792345705]
都市部を正確にかつ包括的に表現することは,様々な都市計画・分析業務に不可欠である。
本研究では,複数のグラフから包括的依存関係を抽出し,都市域のリッチな意味表現を学習することを目的としたAttentive Graph Enhanced Region Representation Learning (ATGRL)モデルを提案する。
論文 参考訳(メタデータ) (2023-07-06T16:38:43Z) - Urban Region Profiling via A Multi-Graph Representation Learning
Framework [0.0]
本研究では,都市域のプロファイリングのための多グラフ代表学習フレームワークであるRerea2Vecを提案する。
実世界のデータセットの実験によると、Rerea2Vecは3つのアプリケーションで使用でき、最先端のベースラインをすべて上回っている。
論文 参考訳(メタデータ) (2022-02-04T11:05:37Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。