Fugu-MT 論文翻訳(概要): Jointly Learning Representations for Map Entities via Heterogeneous Graph Contrastive Learning

論文の概要: Jointly Learning Representations for Map Entities via Heterogeneous Graph Contrastive Learning

arxiv url: http://arxiv.org/abs/2402.06135v1
Date: Fri, 9 Feb 2024 01:47:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-12 18:19:21.885573
Title: Jointly Learning Representations for Map Entities via Heterogeneous Graph Contrastive Learning
Title（参考訳）: 不均一グラフコントラスト学習による地図エンティティの協調学習表現
Authors: Jiawei Jiang, Yifan Yang, Jingyuan Wang, Junjie Wu
Abstract要約: マップエンティティの複数カテゴリの表現を学習するためのHOME-GCLという新しい手法を提案する。本手法では,道路セグメントとランドパーセルの両方を統一したフレームワークに統合するヘテロジニアスマップエンティティグラフ(HOMEグラフ)を用いる。我々の知る限り、HOME-GCLは統一モデルを用いて道路セグメントと土地区画の表現を共同で学習する最初の試みである。
参考スコア（独自算出の注目度）: 38.415692986360995
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The electronic map plays a crucial role in geographic information systems, serving various urban managerial scenarios and daily life services. Developing effective Map Entity Representation Learning (MERL) methods is crucial to extracting embedding information from electronic maps and converting map entities into representation vectors for downstream applications. However, existing MERL methods typically focus on one specific category of map entities, such as POIs, road segments, or land parcels, which is insufficient for real-world diverse map-based applications and might lose latent structural and semantic information interacting between entities of different types. Moreover, using representations generated by separate models for different map entities can introduce inconsistencies. Motivated by this, we propose a novel method named HOME-GCL for learning representations of multiple categories of map entities. Our approach utilizes a heterogeneous map entity graph (HOME graph) that integrates both road segments and land parcels into a unified framework. A HOME encoder with parcel-segment joint feature encoding and heterogeneous graph transformer is then deliberately designed to convert segments and parcels into representation vectors. Moreover, we introduce two types of contrastive learning tasks, namely intra-entity and inter-entity tasks, to train the encoder in a self-supervised manner. Extensive experiments on three large-scale datasets covering road segment-based, land parcel-based, and trajectory-based tasks demonstrate the superiority of our approach. To the best of our knowledge, HOME-GCL is the first attempt to jointly learn representations for road segments and land parcels using a unified model.
Abstract（参考訳）: 電子地図は地理情報システムにおいて重要な役割を担い、様々な都市管理シナリオや日常生活サービスに役立っている。効率的なMap Entity Representation Learning(MERL)手法の開発は、電子地図から埋め込み情報を抽出し、下流アプリケーションのための表現ベクトルに変換する上で重要である。しかし、既存のMERL法は一般に、POI、道路セグメント、ランドパーセルなどの特定のマップエンティティのカテゴリに焦点を合わせており、これは現実世界の多様なマップベースアプリケーションには不十分であり、異なるタイプのエンティティ間で相互作用する潜在構造情報や意味情報を失う可能性がある。さらに、異なるマップエンティティに対して別々のモデルによって生成された表現を使用することで、矛盾を導入することができる。そこで本研究では,マップエンティティの複数カテゴリの表現を学習するためのHOME-GCLという新しい手法を提案する。本手法では,道路セグメントとランドパーセルの両方を統一したフレームワークに統合するヘテロジニアスマップエンティティグラフ(HOMEグラフ)を用いる。パーセルセグメントのジョイント特徴エンコーディングと異種グラフトランスフォーマを備えたホームエンコーダは、セグメントとパーセルを表現ベクトルに変換するために意図的に設計されている。さらに,エンコーダを自己教師付きで訓練するために,エンティティ内タスクとエンティティ間タスクという,2種類のコントラスト学習タスクを導入する。道路セグメントベース,ランドパーセルベース,トラジェクトリベースの3つの大規模データセットに対する大規模な実験は,我々のアプローチの優位性を示している。我々の知る限り、HOME-GCLは統一モデルを用いて道路セグメントと土地区画の表現を共同で学習する最初の試みである。

関連論文リスト

Learning Global Representation from Queries for Vectorized HD Map Construction [37.400007014018]
我々は、textbfMapGR (textbfGlobal textbfRepresentation Learning for HD textbfMap construction)を提案する。 Global Representation Learning (GRL)モジュールは、グローバルマップとの整合性を高めるために、すべてのクエリの分散を促進する。 Global Representation Guidance(GRG)モジュールは、各クエリに対して、その最適化を容易にするために、明示的なグローバルレベルのコンテキスト情報を提供する。
論文参考訳（メタデータ） (2025-10-08T12:56:08Z)
SegMASt3R: Geometry Grounded Segment Matching [23.257530861472656]
我々は3次元基礎モデルの空間的理解を活用して,広義のセグメントマッチングに取り組む。本稿では,これら3次元基礎モデルの帰納バイアスを利用して,最大180度の視点変化回転で画像対間のセグメントをマッチングするアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-10-06T17:31:32Z)
InteractionMap: Improving Online Vectorized HDMap Construction with Interaction [0.4551615447454768]
State-of-the-art map vectorization法は主に、エンドツーエンドでHDマップを生成するDETRライクなフレームワークに基づいている。本稿では,ローカル-グローバル情報インタラクションをフル活用して,従来の地図ベクトル化手法を改善したInteractionMapを提案する。
論文参考訳（メタデータ） (2025-03-27T16:23:15Z)
IC-Mapper: Instance-Centric Spatio-Temporal Modeling for Online Vectorized Map Construction [18.975185033472968]
IC-Mapperは2つの主要なコンポーネントで構成されるインスタンス中心のオンラインマッピングフレームワークである。空間次元から歴史的グローバルマップの点サンプリングを行い、現在のフレームに対応するインスタンスの検出結果と統合して、地図のリアルタイム展開と更新を行う。
論文参考訳（メタデータ） (2025-03-05T20:28:34Z)
Bridging Scales in Map Generation: A scale-aware cascaded generative mapping framework for seamless and consistent multi-scale cartographic representation [2.414525855161937]
マルチスケールタイルマップは地理情報サービスに不可欠であり、測量と地図の基本的な成果となる。現在のアプローチでは、動的マルチスケール生成と地図一般化原理の不十分な統合とタイルワイズ生成による空間的不連続の2つの根本的な課題に直面している。本研究では,条件付き誘導拡散とマルチスケールカスケードアーキテクチャを利用するスケール対応地図生成フレームワーク(SCGM)を提案する。
論文参考訳（メタデータ） (2025-02-07T15:11:31Z)
Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.316692263196277]
MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。 GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文参考訳（メタデータ） (2024-10-17T03:56:12Z)
MGMapNet: Multi-Granularity Representation Learning for End-to-End Vectorized HD Map Construction [75.93907511203317]
多粒性表現を持つ地図要素をモデル化するためのMGMapNet(Multi-Granularity Map Network)を提案する。提案したMGMapNetは最先端のパフォーマンスを達成し,MapTRv2 を nuScenes で 5.3 mAP,Argoverse2 で 4.4 mAP で上回った。
論文参考訳（メタデータ） (2024-10-10T09:05:23Z)
HPix: Generating Vector Maps from Satellite Images [0.0]
衛星画像からベクトルタイルマップを生成するためにGAN(Generative Adversarial Networks)を改良したHPixと呼ばれる新しい手法を提案する。経験的評価を通じて,提案手法は高精度かつ視覚的に表現可能なベクトルタイルマップを作成する上での有効性を示す。さらに、道路交差点のマッピングや、その面積に基づいたフットプリントクラスタの構築など、我々の研究の応用を拡大する。
論文参考訳（メタデータ） (2024-07-18T16:54:02Z)
LISNeRF Mapping: LiDAR-based Implicit Mapping via Semantic Neural Fields for Large-Scale 3D Scenes [2.822816116516042]
大規模セマンティックマッピングは、屋外の自律エージェントが計画やナビゲーションといった高度なタスクを遂行するために不可欠である。本稿では,提案するLiDAR測度のみでの暗黙的表現による大規模3次元意味再構築手法を提案する。
論文参考訳（メタデータ） (2023-11-04T03:55:38Z)
Multi-label affordance mapping from egocentric vision [3.683202928838613]
本稿では, 精度の高い多ラベルセグメンテーションを実現するために, 空き感に対する新しいアプローチを提案する。我々の手法は、ファースト・パーソン・ビデオから空き地を自動的に抽出するために利用できる。相互作用ホットスポットのマップを構築するために、メトリック表現をどのように活用できるかを示します。
論文参考訳（メタデータ） (2023-09-05T10:56:23Z)
Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。 IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文参考訳（メタデータ） (2022-06-17T09:40:14Z)
Improving Lidar-Based Semantic Segmentation of Top-View Grid Maps by Learning Features in Complementary Representations [3.0413873719021995]
我々は、自律運転の文脈において、スパースで単発のLiDAR測定から意味情報を予測するための新しい方法を提案する。このアプローチは、トップビューグリッドマップのセマンティックセグメンテーションを改善することを目的としている。各表現に対して、セマンティック情報を効果的に抽出するために、調整されたディープラーニングアーキテクチャが開発された。
論文参考訳（メタデータ） (2022-03-02T14:49:51Z)
Learning Lane Graph Representations for Motion Forecasting [92.88572392790623]
生の地図データからレーングラフを構築し,地図構造を保存する。我々は,アクター・トゥ・レーン,レーン・トゥ・レーン,レーン・トゥ・アクター,アクター・トゥ・アクターの4種類のインタラクションからなる融合ネットワークを利用する。提案手法は,大規模Argoverse運動予測ベンチマークにおいて,最先端の手法を著しく上回っている。
論文参考訳（メタデータ） (2020-07-27T17:59:49Z)
Bidirectional Graph Reasoning Network for Panoptic Segmentation [126.06251745669107]
本稿では,BGRNet(Bidirectional Graph Reasoning Network)を導入し,前景物と背景物間のモジュラー内およびモジュラー間関係について検討する。 BGRNetはまず、インスタンスとセマンティックセグメンテーションの両方でイメージ固有のグラフを構築し、提案レベルとクラスレベルで柔軟な推論を可能にする。
論文参考訳（メタデータ） (2020-04-14T02:32:10Z)
Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文参考訳（メタデータ） (2020-02-18T07:57:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。