論文の概要: HIMap: HybrId Representation Learning for End-to-end Vectorized HD Map
Construction
- arxiv url: http://arxiv.org/abs/2403.08639v1
- Date: Wed, 13 Mar 2024 15:51:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 13:38:23.363801
- Title: HIMap: HybrId Representation Learning for End-to-end Vectorized HD Map
Construction
- Title(参考訳): HIMap: エンドツーエンドのベクトル化HDマップのためのHybrId表現学習
建築
- Authors: Yi Zhou, Hui Zhang, Jiaqian Yu, Yifan Yang, Sangil Jung, Seung-In
Park, ByungIn Yoo
- Abstract要約: State-of-the-art法は主に正確な点座標を回帰する点レベルの表現学習に基づいている。
本稿では,HybrId フレームワーク HIMap を提案する。
我々は、大規模な実験を行い、nuScenesとArgoverse2データセットの両方で、従来手法より一貫して優れています。
- 参考スコア(独自算出の注目度): 16.12831707986132
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vectorized High-Definition (HD) map construction requires predictions of the
category and point coordinates of map elements (e.g. road boundary, lane
divider, pedestrian crossing, etc.). State-of-the-art methods are mainly based
on point-level representation learning for regressing accurate point
coordinates. However, this pipeline has limitations in obtaining element-level
information and handling element-level failures, e.g. erroneous element shape
or entanglement between elements. To tackle the above issues, we propose a
simple yet effective HybrId framework named HIMap to sufficiently learn and
interact both point-level and element-level information. Concretely, we
introduce a hybrid representation called HIQuery to represent all map elements,
and propose a point-element interactor to interactively extract and encode the
hybrid information of elements, e.g. point position and element shape, into the
HIQuery. Additionally, we present a point-element consistency constraint to
enhance the consistency between the point-level and element-level information.
Finally, the output point-element integrated HIQuery can be directly converted
into map elements' class, point coordinates, and mask. We conduct extensive
experiments and consistently outperform previous methods on both nuScenes and
Argoverse2 datasets. Notably, our method achieves $77.8$ mAP on the nuScenes
dataset, remarkably superior to previous SOTAs by $8.3$ mAP at least.
- Abstract(参考訳): ベクトル化ハイディフィニション(HD)マップ構築は、地図要素(例えば、道路境界、車線分割、歩行者横断など)のカテゴリーと点座標の予測を必要とする。
State-of-the-art法は主に正確な点座標を回帰する点レベルの表現学習に基づいている。
しかし、このパイプラインは要素レベルの情報を取得し、要素間の誤った要素形状や絡み合いなど、要素レベルの障害を処理するのに制限がある。
以上の課題に対処するために,HIMap というシンプルなHybrId フレームワークを提案し,ポイントレベル情報と要素レベル情報の両方を十分に学習し,相互作用させる。
具体的には、すべての地図要素を表現するためにHIQueryと呼ばれるハイブリッド表現を導入し、要素のハイブリッド情報を対話的に抽出し、egポイント位置と要素形状をHIQueryにエンコードするポイント要素インターセプタを提案する。
さらに,ポイントレベルの情報と要素レベルの情報の整合性を高めるために,ポイント要素の整合性制約を提案する。
最後に、出力ポイント要素統合HIQueryは、マップ要素のクラス、ポイント座標、マスクに直接変換できる。
我々は、大規模な実験を行い、nuScenesとArgoverse2データセットの両方で、従来手法より一貫して優れています。
特に,本手法は, nuScenesデータセット上で77.8ドルmAPを達成し, 従来のSOTAよりも少なくとも8.3ドルmAPの方がはるかに優れている。
関連論文リスト
- MGMapNet: Multi-Granularity Representation Learning for End-to-End Vectorized HD Map Construction [75.93907511203317]
多粒性表現を持つ地図要素をモデル化するためのMGMapNet(Multi-Granularity Map Network)を提案する。
提案したMGMapNetは最先端のパフォーマンスを達成し,MapTRv2 を nuScenes で 5.3 mAP,Argoverse2 で 4.4 mAP で上回った。
論文 参考訳(メタデータ) (2024-10-10T09:05:23Z) - RoboHop: Segment-based Topological Map Representation for Open-World Visual Navigation [18.053914853235142]
画像セグメントに基づく新しい環境表現を提案する。
3次元シーングラフとは異なり、セグメントをノードとする純粋に位相グラフを作成する。
これはセグメント間の永続性によって定義される「場所の連続的な感覚」を明らかにする。
論文 参考訳(メタデータ) (2024-05-09T14:17:26Z) - Skipped Feature Pyramid Network with Grid Anchor for Object Detection [6.99246486061412]
特徴ピラミッドの各レベルにおいてより強力な意味論を得るために,スキップ接続を提案する。
提案手法では,各レベルが一定スケールの物体を検知する責任を負うことがより合理的である。
論文 参考訳(メタデータ) (2023-10-22T23:27:05Z) - MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction [40.07726377230152]
High-definition (HD) マップは、運転シーンの豊富な正確な静的環境情報を提供する。
オンラインベクトル化HDマップ構築のためのエンドツーエンドフレームワークである textbfMap textbfTRansformer を提案する。
論文 参考訳(メタデータ) (2023-08-10T17:56:53Z) - Improving Semantic Segmentation in Transformers using Hierarchical
Inter-Level Attention [68.7861229363712]
Hierarchical Inter-Level Attention (HILA)は、異なるレベルの機能間のボトムアップとトップダウン更新をキャプチャするアテンションベースの手法である。
HILAは階層型ヴィジュアルトランスフォーマーアーキテクチャを拡張し、上位と下位の機能間の局所的な接続をバックボーンエンコーダに追加する。
より少ないパラメータとFLOPSを用いたセマンティックセグメンテーションでは,精度が顕著に向上した。
論文 参考訳(メタデータ) (2022-07-05T15:47:31Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Deep Hierarchical Semantic Segmentation [76.40565872257709]
階層的セマンティックセマンティックセグメンテーション(HSS)は、クラス階層の観点で視覚的観察を構造化、ピクセル単位で記述することを目的としている。
HSSNは、HSSを画素単位のマルチラベル分類タスクとしてキャストし、現在のセグメンテーションモデルに最小限のアーキテクチャ変更をもたらすだけである。
階層構造によって引き起こされるマージンの制約により、HSSNはピクセル埋め込み空間を再評価し、よく構造化されたピクセル表現を生成する。
論文 参考訳(メタデータ) (2022-03-27T15:47:44Z) - PointFlow: Flowing Semantics Through Points for Aerial Image
Segmentation [96.76882806139251]
本論文では,FPN(Feature Pyramid Network)フレームワークに基づく点親和性伝播モジュールであるPointFlowを提案する。
密接な親和性学習ではなく、隣接する特徴間の選択された点にスパース親和性マップを生成する。
3つの異なる空中セグメンテーションデータセットの実験結果から,提案手法は最先端の汎用セグメンテーション法よりも効率的かつ効率的であることが示唆された。
論文 参考訳(メタデータ) (2021-03-11T09:42:32Z) - Label Decoupling Framework for Salient Object Detection [157.96262922808245]
近年の手法は, 畳み込みネットワーク(FCN)からの多層的特徴の集約と, エッジ情報の導入に重点を置いている。
ラベルデカップリング手順と機能相互作用ネットワーク(FIN)からなるラベルデカップリングフレームワーク(LDF)を提案する。
6つのベンチマークデータセットの実験では、LDFはさまざまな評価指標における最先端のアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-08-25T14:23:38Z) - Interpretable Foreground Object Search As Knowledge Distillation [34.8831793663634]
まず、交換可能なフォアグラウンドのラベルを含むパターンレベルのFoSデータセットを構築するパイプラインを提示する。
そして、パイプラインに続くさらなるトレーニングとテストのためのベンチマークデータセットを構築します。
提案手法は, 平均平均精度 (mAP) で評価し, 絶対差が10.42%, 相対改善が24.06%向上した。
論文 参考訳(メタデータ) (2020-07-20T03:37:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。