論文の概要: HPL-ViT: A Unified Perception Framework for Heterogeneous Parallel
LiDARs in V2V
- arxiv url: http://arxiv.org/abs/2309.15572v1
- Date: Wed, 27 Sep 2023 10:55:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-28 14:03:30.243035
- Title: HPL-ViT: A Unified Perception Framework for Heterogeneous Parallel
LiDARs in V2V
- Title(参考訳): HPL-ViT:V2Vにおける不均一並列LiDARの統一認識フレームワーク
- Authors: Yuhang Liu and Boyi Sun and Yuke Li and Yuzheng Hu and Fei-Yue Wang
- Abstract要約: 並列LiDARの新たなフレームワークを提案し,実験プラットフォームDAWNでハードウェアプロトタイプを構築した。
LiDARシステムにおける物理空間とデジタル空間の密接な統合を強調しており、ネットワークはサポート対象のコア機能の一つである。
我々はヘテロジニアスおよび動的シナリオにおけるロバストな特徴融合のために設計された先駆的アーキテクチャであるHPL-ViTを提案する。
- 参考スコア(独自算出の注目度): 22.680769938383822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To develop the next generation of intelligent LiDARs, we propose a novel
framework of parallel LiDARs and construct a hardware prototype in our
experimental platform, DAWN (Digital Artificial World for Natural). It
emphasizes the tight integration of physical and digital space in LiDAR
systems, with networking being one of its supported core features. In the
context of autonomous driving, V2V (Vehicle-to-Vehicle) technology enables
efficient information sharing between different agents which significantly
promotes the development of LiDAR networks. However, current research operates
under an ideal situation where all vehicles are equipped with identical LiDAR,
ignoring the diversity of LiDAR categories and operating frequencies. In this
paper, we first utilize OpenCDA and RLS (Realistic LiDAR Simulation) to
construct a novel heterogeneous LiDAR dataset named OPV2V-HPL. Additionally, we
present HPL-ViT, a pioneering architecture designed for robust feature fusion
in heterogeneous and dynamic scenarios. It uses a graph-attention Transformer
to extract domain-specific features for each agent, coupled with a
cross-attention mechanism for the final fusion. Extensive experiments on
OPV2V-HPL demonstrate that HPL-ViT achieves SOTA (state-of-the-art) performance
in all settings and exhibits outstanding generalization capabilities.
- Abstract(参考訳): 次世代のインテリジェントLiDARを開発するため,我々は並列LiDARの新たなフレームワークを提案し,実験プラットフォームDAWN(Digital Artificial World for Natural)にハードウェアプロトタイプを構築した。
LiDARシステムにおける物理空間とデジタル空間の密接な統合を強調しており、ネットワークはサポート対象のコア機能の一つである。
自律運転において、V2V(Vehicle-to-Vehicle)技術は、異なるエージェント間の効率的な情報共有を可能にし、LiDARネットワークの開発を著しく促進する。
しかし、現在の研究は、全ての車両が同一のLiDARを備えており、LiDARのカテゴリや運用周波数の多様性を無視している理想的な状況下で活動している。
本稿では、まずOpenCDAとRSS(Realistic LiDAR Simulation)を用いて、新しい異種LiDARデータセットOPV2V-HPLを構築する。
さらにヘテロジニアスおよび動的シナリオにおけるロバストな特徴融合を目的とした先駆的アーキテクチャであるHPL-ViTを提案する。
グラフアテンション変換を使用して各エージェントのドメイン固有の特徴を抽出し、最終核融合のためのクロスアテンション機構と組み合わせる。
OPV2V-HPLに関する大規模な実験は、HPL-ViTが全ての設定でSOTA(state-of-the-art)性能を達成し、優れた一般化能力を示すことを示した。
関連論文リスト
- LaVin-DiT: Large Vision Diffusion Transformer [99.98106406059333]
LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。
視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。
このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文 参考訳(メタデータ) (2024-11-18T12:05:27Z) - Automatically Learning Hybrid Digital Twins of Dynamical Systems [56.69628749813084]
Digital Twins (DT)は、現実世界のシステムの状態と時間力学をシミュレートする。
DTは、しばしばデータスカース設定で目に見えない条件に一般化するのに苦労します。
本稿では,HDTwinsを自律的に提案し,評価し,最適化するための進化的アルゴリズム(textbfHDTwinGen$)を提案する。
論文 参考訳(メタデータ) (2024-10-31T07:28:22Z) - T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design [79.7289790249621]
提案手法であるT2V-Turbo-v2は、様々な監視信号を統合することにより、大幅な進歩をもたらす。
特定の学習目標に対するデータセットの調整の重要性を強調した。
トレーニングデータセットから動作ガイダンスを抽出し,ODEソルバに組み込むことにより,このアプローチの可能性を示す。
論文 参考訳(メタデータ) (2024-10-08T04:30:06Z) - LiDAR-GS:Real-time LiDAR Re-Simulation using Gaussian Splatting [50.808933338389686]
LiDARシミュレーションは、自動運転におけるクローズドループシミュレーションにおいて重要な役割を果たす。
都市景観におけるLiDARセンサスキャンをリアルタイムに再現するために,最初のLiDARガウス法であるLiDAR-GSを提案する。
我々の手法は、深度、強度、レイドロップチャンネルを同時に再現することに成功し、公開可能な大規模シーンデータセットにおけるフレームレートと品質の両方のレンダリング結果を達成する。
論文 参考訳(メタデータ) (2024-10-07T15:07:56Z) - SFPNet: Sparse Focal Point Network for Semantic Segmentation on General LiDAR Point Clouds [13.097858142421519]
本稿では、ウィンドウアテンションをスパース焦点変調に置き換えることで、市場で広く普及している様々なLiDARに対応するためのフレームワークを提案する。
我々のSFPNetは、複数のレベルのコンテキストを抽出し、ゲート機構を用いて動的に集約することができる。
また,ロボットアプリケーションのための大規模ハイブリッド型LiDARセマンティックセマンティックセマンティックセマンティックデータセットについても紹介する。
論文 参考訳(メタデータ) (2024-07-16T10:22:09Z) - V2I-Calib: A Novel Calibration Approach for Collaborative Vehicle and Infrastructure LiDAR Systems [19.919120489121987]
本稿では,V2Iキャリブレーションに新たなアプローチを導入し,知覚対象間の空間的関連情報を活用する。
この手法の中心は、車両とインフラシステムによって識別されるターゲット間の相関を定量化する、イノベーティブなOIoU(Intersection over Union)計量である。
当社のアプローチでは,親和性行列の構築を通じて,車両とインフラのLiDARシステムの認識結果における共通目標の同定を行う。
論文 参考訳(メタデータ) (2024-07-14T13:34:00Z) - Talk to Parallel LiDARs: A Human-LiDAR Interaction Method Based on 3D Visual Grounding [16.01111155569546]
並列LiDARに3D視覚グラウンドタスクを導入し、LiDARシステムのための新しいヒューマン・コンピュータインタラクションパラダイムを提案する。
本研究では,自律運転における3次元視覚的接地に適した大規模ベンチマークデータセットであるTalk2LiDARを提案する。
Talk2Car-3DおよびTalk2LiDARデータセットに関する実験は、BEVの優れた性能を示す。
論文 参考訳(メタデータ) (2024-05-24T07:00:45Z) - V2X-ViT: Vehicle-to-Everything Cooperative Perception with Vision
Transformer [58.71845618090022]
我々は、道路上のエージェント間で情報を融合するために、V2X-ViTという全体論的アテンションモデルを構築した。
V2X-ViTは異質なマルチエージェント自己アテンションとマルチスケールウィンドウ自己アテンションの交互層から構成される。
我々のアプローチを検証するために、我々は大規模なV2X知覚データセットを作成します。
論文 参考訳(メタデータ) (2022-03-20T20:18:25Z) - Self-Organizing mmWave MIMO Cell-Free Networks With Hybrid Beamforming:
A Hierarchical DRL-Based Design [30.70798412145064]
セルフリー無線ネットワークにおいて、分散アクセスポイント(AP)は、同じ時間/周波数リソースを用いて、カバーエリア内のすべてのユーザ機器(UE)を共同で提供する。
深層学習(DRL)に基づく複数のネットワーク分割を提案する。
異なるセルフリーワーク間の干渉を設計するために,新しいハイブリッドビームストデジタルビームモデルを開発した。
論文 参考訳(メタデータ) (2021-03-17T03:31:52Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。