論文の概要: Jointly Learning Representations for Map Entities via Heterogeneous
Graph Contrastive Learning
- arxiv url: http://arxiv.org/abs/2402.06135v1
- Date: Fri, 9 Feb 2024 01:47:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 18:19:21.885573
- Title: Jointly Learning Representations for Map Entities via Heterogeneous
Graph Contrastive Learning
- Title(参考訳): 不均一グラフコントラスト学習による地図エンティティの協調学習表現
- Authors: Jiawei Jiang, Yifan Yang, Jingyuan Wang, Junjie Wu
- Abstract要約: マップエンティティの複数カテゴリの表現を学習するためのHOME-GCLという新しい手法を提案する。
本手法では,道路セグメントとランドパーセルの両方を統一したフレームワークに統合するヘテロジニアスマップエンティティグラフ(HOMEグラフ)を用いる。
我々の知る限り、HOME-GCLは統一モデルを用いて道路セグメントと土地区画の表現を共同で学習する最初の試みである。
- 参考スコア(独自算出の注目度): 38.415692986360995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The electronic map plays a crucial role in geographic information systems,
serving various urban managerial scenarios and daily life services. Developing
effective Map Entity Representation Learning (MERL) methods is crucial to
extracting embedding information from electronic maps and converting map
entities into representation vectors for downstream applications. However,
existing MERL methods typically focus on one specific category of map entities,
such as POIs, road segments, or land parcels, which is insufficient for
real-world diverse map-based applications and might lose latent structural and
semantic information interacting between entities of different types. Moreover,
using representations generated by separate models for different map entities
can introduce inconsistencies. Motivated by this, we propose a novel method
named HOME-GCL for learning representations of multiple categories of map
entities. Our approach utilizes a heterogeneous map entity graph (HOME graph)
that integrates both road segments and land parcels into a unified framework. A
HOME encoder with parcel-segment joint feature encoding and heterogeneous graph
transformer is then deliberately designed to convert segments and parcels into
representation vectors. Moreover, we introduce two types of contrastive
learning tasks, namely intra-entity and inter-entity tasks, to train the
encoder in a self-supervised manner. Extensive experiments on three large-scale
datasets covering road segment-based, land parcel-based, and trajectory-based
tasks demonstrate the superiority of our approach. To the best of our
knowledge, HOME-GCL is the first attempt to jointly learn representations for
road segments and land parcels using a unified model.
- Abstract(参考訳): 電子地図は地理情報システムにおいて重要な役割を担い、様々な都市管理シナリオや日常生活サービスに役立っている。
効率的なMap Entity Representation Learning(MERL)手法の開発は、電子地図から埋め込み情報を抽出し、下流アプリケーションのための表現ベクトルに変換する上で重要である。
しかし、既存のMERL法は一般に、POI、道路セグメント、ランドパーセルなどの特定のマップエンティティのカテゴリに焦点を合わせており、これは現実世界の多様なマップベースアプリケーションには不十分であり、異なるタイプのエンティティ間で相互作用する潜在構造情報や意味情報を失う可能性がある。
さらに、異なるマップエンティティに対して別々のモデルによって生成された表現を使用することで、矛盾を導入することができる。
そこで本研究では,マップエンティティの複数カテゴリの表現を学習するためのHOME-GCLという新しい手法を提案する。
本手法では,道路セグメントとランドパーセルの両方を統一したフレームワークに統合するヘテロジニアスマップエンティティグラフ(HOMEグラフ)を用いる。
パーセルセグメントのジョイント特徴エンコーディングと異種グラフトランスフォーマを備えたホームエンコーダは、セグメントとパーセルを表現ベクトルに変換するために意図的に設計されている。
さらに,エンコーダを自己教師付きで訓練するために,エンティティ内タスクとエンティティ間タスクという,2種類のコントラスト学習タスクを導入する。
道路セグメントベース,ランドパーセルベース,トラジェクトリベースの3つの大規模データセットに対する大規模な実験は,我々のアプローチの優位性を示している。
我々の知る限り、HOME-GCLは統一モデルを用いて道路セグメントと土地区画の表現を共同で学習する最初の試みである。
関連論文リスト
- Mapping High-level Semantic Regions in Indoor Environments without
Object Recognition [50.624970503498226]
本研究では,屋内環境における埋め込みナビゲーションによる意味領域マッピング手法を提案する。
地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。
グローバルなフレームにエゴセントリックなシーン理解を投影することにより、提案手法は各場所の可能な領域ラベル上の分布としてのセマンティックマップを生成する。
論文 参考訳(メタデータ) (2024-03-11T18:09:50Z) - Multi-label affordance mapping from egocentric vision [3.683202928838613]
本稿では, 精度の高い多ラベルセグメンテーションを実現するために, 空き感に対する新しいアプローチを提案する。
我々の手法は、ファースト・パーソン・ビデオから空き地を自動的に抽出するために利用できる。
相互作用ホットスポットのマップを構築するために、メトリック表現をどのように活用できるかを示します。
論文 参考訳(メタデータ) (2023-09-05T10:56:23Z) - Towards accurate instance segmentation in large-scale LiDAR point clouds [17.808580509435565]
パノプティックセグメンテーション(英: Panoptic segmentation)は、セグメンテーションとインスタンスセグメンテーションの組み合わせである。
本研究では,オブジェクトインスタンスへのクラスタリング点に関する汎視的セグメンテーションパイプラインのステップについて検討する。
複数の学習点埋め込みを活用するクラスタリング戦略が,インスタンスのセグメンテーションを大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-07-06T09:29:03Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Improving Lidar-Based Semantic Segmentation of Top-View Grid Maps by
Learning Features in Complementary Representations [3.0413873719021995]
我々は、自律運転の文脈において、スパースで単発のLiDAR測定から意味情報を予測するための新しい方法を提案する。
このアプローチは、トップビューグリッドマップのセマンティックセグメンテーションを改善することを目的としている。
各表現に対して、セマンティック情報を効果的に抽出するために、調整されたディープラーニングアーキテクチャが開発された。
論文 参考訳(メタデータ) (2022-03-02T14:49:51Z) - Reachability Embeddings: Scalable Self-Supervised Representation
Learning from Markovian Trajectories for Geospatial Computer Vision [0.0]
ラベルのないGPSトラジェクトリから地理的位置の表現を学習するための自己教師付き手法を提案する。
スケーラブルで分散されたアルゴリズムは、リーチビリティ・サマリーと呼ばれるイメージライクな表現を計算するために提示される。
到達可能性埋め込みは意味的に意味のある表現であり、結果として性能が4~23%向上することを示す。
論文 参考訳(メタデータ) (2021-10-24T20:10:22Z) - Rethinking Semantic Segmentation Evaluation for Explainability and Model
Selection [12.786648212233116]
地域ベースのオーバーおよびアンダーセグメンテーションを評価するための新しいメトリクスを紹介します。
分析して他のメトリクスと比較し、実世界のアプリケーションにおけるセマンティックセグメンテーションモデルのパフォーマンスをより説明しやすくなることを示す。
論文 参考訳(メタデータ) (2021-01-21T03:12:43Z) - Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。
我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。
提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-27T17:59:49Z) - Bidirectional Graph Reasoning Network for Panoptic Segmentation [126.06251745669107]
本稿では,BGRNet(Bidirectional Graph Reasoning Network)を導入し,前景物と背景物間のモジュラー内およびモジュラー間関係について検討する。
BGRNetはまず、インスタンスとセマンティックセグメンテーションの両方でイメージ固有のグラフを構築し、提案レベルとクラスレベルで柔軟な推論を可能にする。
論文 参考訳(メタデータ) (2020-04-14T02:32:10Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。