論文の概要: HybriMap: Hybrid Clues Utilization for Effective Vectorized HD Map Construction
- arxiv url: http://arxiv.org/abs/2404.11155v1
- Date: Wed, 17 Apr 2024 08:08:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-18 14:55:00.585487
- Title: HybriMap: Hybrid Clues Utilization for Effective Vectorized HD Map Construction
- Title(参考訳): HybriMap: 効率的なベクトル化HDマップ構築のためのハイブリッドクラスタ利用
- Authors: Chi Zhang, Qi Song, Feifei Li, Yongquan Chen, Rui Huang,
- Abstract要約: 一般的なアプローチにおける多段階のシーケンシャルワークフローは、しばしばアーリーステージの情報を失う。
本稿では,ハイブリッド機能からのヒントを効果的に活用し,価値ある情報の配信を確実にする,新しいアプローチである textbfHybriMap を提案する。
- 参考スコア(独自算出の注目度): 25.210691294477012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Constructing vectorized high-definition maps from surround-view cameras has garnered significant attention in recent years. However, the commonly employed multi-stage sequential workflow in prevailing approaches often leads to the loss of early-stage information, particularly in perspective-view features. Usually, such loss is observed as an instance missing or shape mismatching in the final birds-eye-view predictions. To address this concern, we propose a novel approach, namely \textbf{HybriMap}, which effectively exploits clues from hybrid features to ensure the delivery of valuable information. Specifically, we design the Dual Enhancement Module, to enable both explicit integration and implicit modification under the guidance of hybrid features. Additionally, the perspective keypoints are utilized as supervision, further directing the feature enhancement process. Extensive experiments conducted on existing benchmarks have demonstrated the state-of-the-art performance of our proposed approach.
- Abstract(参考訳): 近年,サラウンドビューカメラによるベクトル化高精細マップの構築が注目されている。
しかし、一般的なマルチステージシーケンシャルワークフローは、特に視点的特徴において、しばしばアーリーステージ情報を失う。
通常、このような損失は、最終的な鳥眼視の予測において欠落や形状のミスマッチとして観察される。
この問題に対処するために,我々は,ハイブリッド機能からのヒントを効果的に活用し,価値ある情報の配信を確実にする,新しいアプローチ,すなわち「textbf{HybriMap}」を提案する。
具体的には、ハイブリッド機能のガイダンスの下で、明示的な統合と暗黙的な修正を可能にするために、デュアルエンハンスメントモジュールを設計する。
さらに、視点キーポイントを監督として利用し、機能強化プロセスをさらに指揮する。
既存のベンチマークで行った大規模な実験により,提案手法の最先端性能が実証された。
関連論文リスト
- TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - HeightMapNet: Explicit Height Modeling for End-to-End HD Map Learning [22.871397412478274]
本稿では,道路面の高さ分布と画像特徴の動的関係を確立する新しいフレームワークであるHeightMapNetを紹介する。
本研究では,Bird's-Eye-View (BEV) の機能の精度を従来の手法以上の精度で改善する。
HeightMapNetは、挑戦的なnuScenesとArgoverse 2データセットに関する例外的な結果を示している。
論文 参考訳(メタデータ) (2024-11-03T02:35:17Z) - Harnessing Diffusion Models for Visual Perception with Meta Prompts [68.78938846041767]
本稿では,視覚知覚タスクの拡散モデルを用いた簡易かつ効果的な手法を提案する。
学習可能な埋め込み(メタプロンプト)を事前学習した拡散モデルに導入し、知覚の適切な特徴を抽出する。
提案手法は,NYU 深度 V2 と KITTI の深度推定タスク,および CityScapes のセマンティックセグメンテーションタスクにおいて,新しい性能記録を実現する。
論文 参考訳(メタデータ) (2023-12-22T14:40:55Z) - Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.646582245834324]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - VS-TransGRU: A Novel Transformer-GRU-based Framework Enhanced by
Visual-Semantic Fusion for Egocentric Action Anticipation [33.41226268323332]
エゴセントリックなアクション予測は、一人称視点で将来のアクションを先進的に予測することを目的とした課題である。
既存のほとんどの手法は、視覚入力とリカレントニューラルネットワークに基づくモデルアーキテクチャと損失関数の改善に重点を置いている。
本稿では,新しいビジュアル・セマンティック融合とトランスフォーマーGRUに基づくアクション予測フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-08T06:49:54Z) - Weakly Supervised Video Salient Object Detection via Point Supervision [18.952253968878356]
本稿では,点監督に基づく強力なベースラインモデルを提案する。
経時的情報でサリエンシマップを推定するために, 短期・長期の観点から, フレーム間補完情報を抽出する。
DAVISとDAVSODデータセットを緩和することにより、P-DAVISとP-DAVSODの2つの点教師付きデータセットをラベル付けする。
論文 参考訳(メタデータ) (2022-07-15T03:31:15Z) - Consistency Regularization for Deep Face Anti-Spoofing [69.70647782777051]
顔認証システムでは、顔認証(FAS)が重要な役割を担っている。
このエキサイティングな観察によって、異なる視点の特徴整合性を促進することが、FASモデルを促進するための有望な方法かもしれないと推測する。
FASにおけるEPCR(Embeddding-level and Prediction-level Consistency Regularization)とEPCR(Embeddding-level Consistency Regularization)を併用した。
論文 参考訳(メタデータ) (2021-11-24T08:03:48Z) - Light Field Saliency Detection with Dual Local Graph Learning
andReciprocative Guidance [148.9832328803202]
我々は、グラフネットワークを介して焦点スタック内のインフォメーション融合をモデル化する。
我々は、全焦点パタンを用いて焦点スタック融合過程をガイドする新しいデュアルグラフモデルを構築した。
論文 参考訳(メタデータ) (2021-10-02T00:54:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。