論文の概要: Stream Query Denoising for Vectorized HD Map Construction
- arxiv url: http://arxiv.org/abs/2401.09112v2
- Date: Thu, 18 Jan 2024 03:19:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-19 13:10:45.110204
- Title: Stream Query Denoising for Vectorized HD Map Construction
- Title(参考訳): ベクトル化HDマップ構築のためのストリームクエリDenoising
- Authors: Shuo Wang, Fan Jia, Yingfei Liu, Yucheng Zhao, Zehui Chen, Tiancai
Wang, Chi Zhang, Xiangyu Zhang, Feng Zhao
- Abstract要約: 本稿では,HDマップ構築における時間的モデリングのための新しいアプローチとして,ストリームクエリデノイング(SQD)戦略を紹介する。
提案手法は,前フレームからの地中真実情報に雑音を加えることによって摂動された問合せを識別することを含む。
これにより,ストリームクエリに固有の予測プロセスをシミュレートする。
- 参考スコア(独自算出の注目度): 32.91824536697469
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To enhance perception performance in complex and extensive scenarios within
the realm of autonomous driving, there has been a noteworthy focus on temporal
modeling, with a particular emphasis on streaming methods. The prevailing trend
in streaming models involves the utilization of stream queries for the
propagation of temporal information. Despite the prevalence of this approach,
the direct application of the streaming paradigm to the construction of
vectorized high-definition maps (HD-maps) fails to fully harness the inherent
potential of temporal information. This paper introduces the Stream Query
Denoising (SQD) strategy as a novel approach for temporal modeling in
high-definition map (HD-map) construction. SQD is designed to facilitate the
learning of temporal consistency among map elements within the streaming model.
The methodology involves denoising the queries that have been perturbed by the
addition of noise to the ground-truth information from the preceding frame.
This denoising process aims to reconstruct the ground-truth information for the
current frame, thereby simulating the prediction process inherent in stream
queries. The SQD strategy can be applied to those streaming methods (e.g.,
StreamMapNet) to enhance the temporal modeling. The proposed SQD-MapNet is the
StreamMapNet equipped with SQD. Extensive experiments on nuScenes and
Argoverse2 show that our method is remarkably superior to other existing
methods across all settings of close range and long range. The code will be
available soon.
- Abstract(参考訳): 自律運転の領域における複雑で広範なシナリオにおける知覚性能を高めるために、特にストリーミング手法に焦点を当てた時間的モデリングに注目が集まっている。
ストリーミングモデルにおける一般的なトレンドは、時間情報の伝搬にストリームクエリを利用することである。
このアプローチが普及しているにもかかわらず、ベクトル化ハイデフィニションマップ(HD-maps)の構築へのストリーミングパラダイムの直接的な適用は、時間情報の固有ポテンシャルを完全に活用することができない。
本稿では,HDマップ構築における時間的モデリングのための新しいアプローチとして,ストリームクエリデノイング(SQD)戦略を紹介する。
SQDはストリーミングモデル内のマップ要素間の時間的一貫性の学習を容易にするように設計されている。
提案手法は,前のフレームからの接地情報に対するノイズの追加によりゆるめられたクエリを特徴付けるものである。
このノイズ除去プロセスは、現在のフレームの基底情報を再構築し、ストリームクエリに固有の予測プロセスをシミュレートすることを目的としている。
SQD戦略は、時間的モデリングを強化するために、ストリーミングメソッド(StreamMapNetなど)に適用することができる。
提案されているSQD-MapNetはSQDを備えたStreamMapNetである。
ヌッセンとアルゴバース2を広範囲に実験した結果,近距離と遠距離のすべての設定において,既存の手法よりも優れた方法が得られた。
コードはもうすぐ入手できる。
関連論文リスト
- Temporal Residual Guided Diffusion Framework for Event-Driven Video Reconstruction [23.493813870675197]
イベントベースのビデオ再構成は、ハイダイナミックレンジや高速モーションキャプチャ機能など、そのアドバンテージから注目を集めている。
現在の方法では、連続したイベントフローからの時間情報の抽出が優先され、シーン内の低周波テクスチャの特徴に過度に強調される。
本稿では,時間的・周波数的イベント前処理を効果的に活用する新しい手法である時間的残留ガイド拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-15T11:48:57Z) - StreamMapNet: Streaming Mapping Network for Vectorized Online HD Map
Construction [36.1596833523566]
本稿では,ビデオの時系列時間的モデリングに適応した新しいオンラインマッピングパイプラインであるStreamMapNetを紹介する。
StreamMapNetは、高安定性の大規模ローカルHDマップの構築を支援するマルチポイントアテンションと時間情報を利用する。
論文 参考訳(メタデータ) (2023-08-24T05:22:43Z) - DiffSED: Sound Event Detection with Denoising Diffusion [70.18051526555512]
生成学習の観点からSED問題を再構築する。
具体的には,騒音拡散過程において,雑音のある提案から音の時間境界を生成することを目的としている。
トレーニング中は,ノイズの多い遅延クエリを基本バージョンに変換することで,ノイズ発生過程の逆転を学習する。
論文 参考訳(メタデータ) (2023-08-14T17:29:41Z) - A Fast and Map-Free Model for Trajectory Prediction in Traffics [2.435517936694533]
本稿では,交通地図に依存しない効率的な軌道予測モデルを提案する。
注意機構、LSTM、グラフ畳み込みネットワーク、時間変換器を包括的に活用することにより、我々のモデルは全てのエージェントのリッチな動的および相互作用情報を学習することができる。
提案モデルでは,既存のマップフリー手法と比較して高い性能を達成し,Argoverseデータセット上のほとんどのマップベース最先端手法を超越する。
論文 参考訳(メタデータ) (2023-07-19T08:36:31Z) - Boundary-Denoising for Video Activity Localization [57.9973253014712]
本稿では,映像活動のローカライゼーション問題について,認知的視点から検討する。
具体的には,DenoiseLocというエンコーダデコーダモデルを提案する。
実験によると、DenoiseLocはいくつかのビデオアクティビティ理解タスクで%前進している。
論文 参考訳(メタデータ) (2023-04-06T08:48:01Z) - DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion [137.8749239614528]
そこで我々は,時間的行動検出(TAD)の新しい定式化を提案し,拡散を抑えるDiffTADを提案する。
入力されたランダムな時間的提案を考慮すれば、トリミングされていない長いビデオが与えられたアクションの提案を正確に得ることができる。
論文 参考訳(メタデータ) (2023-03-27T00:40:52Z) - Motion-aware Memory Network for Fast Video Salient Object Detection [15.967509480432266]
我々は、隣接するフレームから現在のフレームの有用な時間情報をVSODの時間枝として抽出する時空間メモリ(STM)ベースのネットワークを設計する。
符号化段階では、電流とその隣接するフレームから高次特徴を用いて高次時間特徴を生成する。
復号化段階では,空間的および時間的分岐に対する効果的な融合戦略を提案する。
提案モデルでは,光学フローなどの前処理を必要とせず,推定時に100FPS近い速度に達することができる。
論文 参考訳(メタデータ) (2022-08-01T15:56:19Z) - Streaming End-to-End ASR based on Blockwise Non-Autoregressive Models [57.20432226304683]
非自己回帰(NAR)モデリングは、音声処理においてますます注目を集めている。
エンドツーエンドのNAR音声認識システムを提案する。
提案手法は低レイテンシ条件下でのオンラインASR認識を改善する。
論文 参考訳(メタデータ) (2021-07-20T11:42:26Z) - Progressive Temporal Feature Alignment Network for Video Inpainting [51.26380898255555]
ビデオ畳み込みは、時間内「破損した地域」に可能な内容で埋めることを目指しています。
現在の方法は、注意、フローベースのワープ、あるいは3次元時間的畳み込みによってこの目標を達成する。
現在のフレームから抽出された特徴を、隣接するフレームから歪んだ特徴で段階的に強化する「プログレッシブ・テンポラリティ・アライメント・ネットワーク」を提案します。
論文 参考訳(メタデータ) (2021-04-08T04:50:33Z) - A Plug-and-play Scheme to Adapt Image Saliency Deep Model for Video Data [54.198279280967185]
本稿では,ビデオデータに対して予め訓練された画像の鮮度深度モデルを弱めに再学習する新しいプラグイン・アンド・プレイ方式を提案する。
本手法は,既訓練画像の深度モデルに適応して高品質な映像の鮮度検出を実現するのに有効である。
論文 参考訳(メタデータ) (2020-08-02T13:23:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。