論文の概要: Jointly Learning Representations for Map Entities via Heterogeneous
Graph Contrastive Learning
- arxiv url: http://arxiv.org/abs/2402.06135v1
- Date: Fri, 9 Feb 2024 01:47:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 18:19:21.885573
- Title: Jointly Learning Representations for Map Entities via Heterogeneous
Graph Contrastive Learning
- Title(参考訳): 不均一グラフコントラスト学習による地図エンティティの協調学習表現
- Authors: Jiawei Jiang, Yifan Yang, Jingyuan Wang, Junjie Wu
- Abstract要約: マップエンティティの複数カテゴリの表現を学習するためのHOME-GCLという新しい手法を提案する。
本手法では,道路セグメントとランドパーセルの両方を統一したフレームワークに統合するヘテロジニアスマップエンティティグラフ(HOMEグラフ)を用いる。
我々の知る限り、HOME-GCLは統一モデルを用いて道路セグメントと土地区画の表現を共同で学習する最初の試みである。
- 参考スコア(独自算出の注目度): 38.415692986360995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The electronic map plays a crucial role in geographic information systems,
serving various urban managerial scenarios and daily life services. Developing
effective Map Entity Representation Learning (MERL) methods is crucial to
extracting embedding information from electronic maps and converting map
entities into representation vectors for downstream applications. However,
existing MERL methods typically focus on one specific category of map entities,
such as POIs, road segments, or land parcels, which is insufficient for
real-world diverse map-based applications and might lose latent structural and
semantic information interacting between entities of different types. Moreover,
using representations generated by separate models for different map entities
can introduce inconsistencies. Motivated by this, we propose a novel method
named HOME-GCL for learning representations of multiple categories of map
entities. Our approach utilizes a heterogeneous map entity graph (HOME graph)
that integrates both road segments and land parcels into a unified framework. A
HOME encoder with parcel-segment joint feature encoding and heterogeneous graph
transformer is then deliberately designed to convert segments and parcels into
representation vectors. Moreover, we introduce two types of contrastive
learning tasks, namely intra-entity and inter-entity tasks, to train the
encoder in a self-supervised manner. Extensive experiments on three large-scale
datasets covering road segment-based, land parcel-based, and trajectory-based
tasks demonstrate the superiority of our approach. To the best of our
knowledge, HOME-GCL is the first attempt to jointly learn representations for
road segments and land parcels using a unified model.
- Abstract(参考訳): 電子地図は地理情報システムにおいて重要な役割を担い、様々な都市管理シナリオや日常生活サービスに役立っている。
効率的なMap Entity Representation Learning(MERL)手法の開発は、電子地図から埋め込み情報を抽出し、下流アプリケーションのための表現ベクトルに変換する上で重要である。
しかし、既存のMERL法は一般に、POI、道路セグメント、ランドパーセルなどの特定のマップエンティティのカテゴリに焦点を合わせており、これは現実世界の多様なマップベースアプリケーションには不十分であり、異なるタイプのエンティティ間で相互作用する潜在構造情報や意味情報を失う可能性がある。
さらに、異なるマップエンティティに対して別々のモデルによって生成された表現を使用することで、矛盾を導入することができる。
そこで本研究では,マップエンティティの複数カテゴリの表現を学習するためのHOME-GCLという新しい手法を提案する。
本手法では,道路セグメントとランドパーセルの両方を統一したフレームワークに統合するヘテロジニアスマップエンティティグラフ(HOMEグラフ)を用いる。
パーセルセグメントのジョイント特徴エンコーディングと異種グラフトランスフォーマを備えたホームエンコーダは、セグメントとパーセルを表現ベクトルに変換するために意図的に設計されている。
さらに,エンコーダを自己教師付きで訓練するために,エンティティ内タスクとエンティティ間タスクという,2種類のコントラスト学習タスクを導入する。
道路セグメントベース,ランドパーセルベース,トラジェクトリベースの3つの大規模データセットに対する大規模な実験は,我々のアプローチの優位性を示している。
我々の知る限り、HOME-GCLは統一モデルを用いて道路セグメントと土地区画の表現を共同で学習する最初の試みである。
関連論文リスト
- Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.316692263196277]
MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。
GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。
実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-10-17T03:56:12Z) - MGMapNet: Multi-Granularity Representation Learning for End-to-End Vectorized HD Map Construction [75.93907511203317]
多粒性表現を持つ地図要素をモデル化するためのMGMapNet(Multi-Granularity Map Network)を提案する。
提案したMGMapNetは最先端のパフォーマンスを達成し,MapTRv2 を nuScenes で 5.3 mAP,Argoverse2 で 4.4 mAP で上回った。
論文 参考訳(メタデータ) (2024-10-10T09:05:23Z) - HPix: Generating Vector Maps from Satellite Images [0.0]
衛星画像からベクトルタイルマップを生成するためにGAN(Generative Adversarial Networks)を改良したHPixと呼ばれる新しい手法を提案する。
経験的評価を通じて,提案手法は高精度かつ視覚的に表現可能なベクトルタイルマップを作成する上での有効性を示す。
さらに、道路交差点のマッピングや、その面積に基づいたフットプリントクラスタの構築など、我々の研究の応用を拡大する。
論文 参考訳(メタデータ) (2024-07-18T16:54:02Z) - LISNeRF Mapping: LiDAR-based Implicit Mapping via Semantic Neural Fields for Large-Scale 3D Scenes [2.822816116516042]
大規模セマンティックマッピングは、屋外の自律エージェントが計画やナビゲーションといった高度なタスクを遂行するために不可欠である。
本稿では,提案するLiDAR測度のみでの暗黙的表現による大規模3次元意味再構築手法を提案する。
論文 参考訳(メタデータ) (2023-11-04T03:55:38Z) - Multi-label affordance mapping from egocentric vision [3.683202928838613]
本稿では, 精度の高い多ラベルセグメンテーションを実現するために, 空き感に対する新しいアプローチを提案する。
我々の手法は、ファースト・パーソン・ビデオから空き地を自動的に抽出するために利用できる。
相互作用ホットスポットのマップを構築するために、メトリック表現をどのように活用できるかを示します。
論文 参考訳(メタデータ) (2023-09-05T10:56:23Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Improving Lidar-Based Semantic Segmentation of Top-View Grid Maps by
Learning Features in Complementary Representations [3.0413873719021995]
我々は、自律運転の文脈において、スパースで単発のLiDAR測定から意味情報を予測するための新しい方法を提案する。
このアプローチは、トップビューグリッドマップのセマンティックセグメンテーションを改善することを目的としている。
各表現に対して、セマンティック情報を効果的に抽出するために、調整されたディープラーニングアーキテクチャが開発された。
論文 参考訳(メタデータ) (2022-03-02T14:49:51Z) - Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。
我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。
提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-27T17:59:49Z) - Bidirectional Graph Reasoning Network for Panoptic Segmentation [126.06251745669107]
本稿では,BGRNet(Bidirectional Graph Reasoning Network)を導入し,前景物と背景物間のモジュラー内およびモジュラー間関係について検討する。
BGRNetはまず、インスタンスとセマンティックセグメンテーションの両方でイメージ固有のグラフを構築し、提案レベルとクラスレベルで柔軟な推論を可能にする。
論文 参考訳(メタデータ) (2020-04-14T02:32:10Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。