Fugu-MT 論文翻訳(概要): HPL-ViT: A Unified Perception Framework for Heterogeneous Parallel LiDARs in V2V

論文の概要: HPL-ViT: A Unified Perception Framework for Heterogeneous Parallel LiDARs in V2V

arxiv url: http://arxiv.org/abs/2309.15572v1
Date: Wed, 27 Sep 2023 10:55:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-28 14:03:30.243035
Title: HPL-ViT: A Unified Perception Framework for Heterogeneous Parallel LiDARs in V2V
Title（参考訳）: HPL-ViT:V2Vにおける不均一並列LiDARの統一認識フレームワーク
Authors: Yuhang Liu and Boyi Sun and Yuke Li and Yuzheng Hu and Fei-Yue Wang
Abstract要約: 並列LiDARの新たなフレームワークを提案し,実験プラットフォームDAWNでハードウェアプロトタイプを構築した。 LiDARシステムにおける物理空間とデジタル空間の密接な統合を強調しており、ネットワークはサポート対象のコア機能の一つである。我々はヘテロジニアスおよび動的シナリオにおけるロバストな特徴融合のために設計された先駆的アーキテクチャであるHPL-ViTを提案する。
参考スコア（独自算出の注目度）: 22.680769938383822
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: To develop the next generation of intelligent LiDARs, we propose a novel framework of parallel LiDARs and construct a hardware prototype in our experimental platform, DAWN (Digital Artificial World for Natural). It emphasizes the tight integration of physical and digital space in LiDAR systems, with networking being one of its supported core features. In the context of autonomous driving, V2V (Vehicle-to-Vehicle) technology enables efficient information sharing between different agents which significantly promotes the development of LiDAR networks. However, current research operates under an ideal situation where all vehicles are equipped with identical LiDAR, ignoring the diversity of LiDAR categories and operating frequencies. In this paper, we first utilize OpenCDA and RLS (Realistic LiDAR Simulation) to construct a novel heterogeneous LiDAR dataset named OPV2V-HPL. Additionally, we present HPL-ViT, a pioneering architecture designed for robust feature fusion in heterogeneous and dynamic scenarios. It uses a graph-attention Transformer to extract domain-specific features for each agent, coupled with a cross-attention mechanism for the final fusion. Extensive experiments on OPV2V-HPL demonstrate that HPL-ViT achieves SOTA (state-of-the-art) performance in all settings and exhibits outstanding generalization capabilities.
Abstract（参考訳）: 次世代のインテリジェントLiDARを開発するため,我々は並列LiDARの新たなフレームワークを提案し,実験プラットフォームDAWN(Digital Artificial World for Natural)にハードウェアプロトタイプを構築した。 LiDARシステムにおける物理空間とデジタル空間の密接な統合を強調しており、ネットワークはサポート対象のコア機能の一つである。自律運転において、V2V(Vehicle-to-Vehicle)技術は、異なるエージェント間の効率的な情報共有を可能にし、LiDARネットワークの開発を著しく促進する。しかし、現在の研究は、全ての車両が同一のLiDARを備えており、LiDARのカテゴリや運用周波数の多様性を無視している理想的な状況下で活動している。本稿では、まずOpenCDAとRSS(Realistic LiDAR Simulation)を用いて、新しい異種LiDARデータセットOPV2V-HPLを構築する。さらにヘテロジニアスおよび動的シナリオにおけるロバストな特徴融合を目的とした先駆的アーキテクチャであるHPL-ViTを提案する。グラフアテンション変換を使用して各エージェントのドメイン固有の特徴を抽出し、最終核融合のためのクロスアテンション機構と組み合わせる。 OPV2V-HPLに関する大規模な実験は、HPL-ViTが全ての設定でSOTA(state-of-the-art)性能を達成し、優れた一般化能力を示すことを示した。

関連論文リスト

GenEDA: Unleashing Generative Reasoning on Netlist via Multimodal Encoder-Decoder Aligned Foundation Model [8.115489346573918]
GenEDAは、回路エンコーダとデコーダを共有潜在空間内で整列させるフレームワークである。このアーキテクチャに基づいて構築されたGenEDAは、ネットリスト上の前例のない3つの生成的推論タスクを可能にする。
論文参考訳（メタデータ） (2025-04-13T08:56:22Z)
LargeAD: Large-Scale Cross-Sensor Data Pretraining for Autonomous Driving [52.83707400688378]
LargeADは多用途でスケーラブルなフレームワークで、さまざまな現実世界の運転データセットにわたる大規模3D事前トレーニング用に設計されている。我々のフレームワークは、VFMを利用して2次元画像から意味的にリッチなスーパーピクセルを抽出し、LiDAR点雲に整列して高品質なコントラストサンプルを生成する。提案手法は,LDARに基づくセグメント化とオブジェクト検出の両面において,線形探索と微調整の両作業において,最先端の手法よりも大幅な性能向上を実現している。
論文参考訳（メタデータ） (2025-01-07T18:59:59Z)
V2XPnP: Vehicle-to-Everything Spatio-Temporal Fusion for Multi-Agent Perception and Prediction [44.40410127660706]
車間通信(V2X)技術は、単一車両システムにおける可観測性を制限するための有望なパラダイムを提供する。以前の研究は主に、異なる場所の情報を融合するが、時間的・時間的手がかりを無視する単一フレーム協調認識に焦点を当てていた。本稿では,1段階,複数段階の通信戦略(送信時)に着目し,その統合を3つの融合戦略で検討する。
論文参考訳（メタデータ） (2024-12-02T18:55:34Z)
LaVin-DiT: Large Vision Diffusion Transformer [99.98106406059333]
LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文参考訳（メタデータ） (2024-11-18T12:05:27Z)
Automatically Learning Hybrid Digital Twins of Dynamical Systems [56.69628749813084]
Digital Twins (DT)は、現実世界のシステムの状態と時間力学をシミュレートする。 DTは、しばしばデータスカース設定で目に見えない条件に一般化するのに苦労します。本稿では,HDTwinsを自律的に提案し,評価し,最適化するための進化的アルゴリズム(textbfHDTwinGen$)を提案する。
論文参考訳（メタデータ） (2024-10-31T07:28:22Z)
T2V-Turbo-v2: Enhancing Video Generation Model Post-Training through Data, Reward, and Conditional Guidance Design [79.7289790249621]
提案手法であるT2V-Turbo-v2は、様々な監視信号を統合することにより、大幅な進歩をもたらす。特定の学習目標に対するデータセットの調整の重要性を強調した。トレーニングデータセットから動作ガイダンスを抽出し,ODEソルバに組み込むことにより,このアプローチの可能性を示す。
論文参考訳（メタデータ） (2024-10-08T04:30:06Z)
LiDAR-GS:Real-time LiDAR Re-Simulation using Gaussian Splatting [50.808933338389686]
LiDARシミュレーションは、自動運転におけるクローズドループシミュレーションにおいて重要な役割を果たす。都市景観におけるLiDARセンサスキャンをリアルタイムに再現するために,最初のLiDARガウス法であるLiDAR-GSを提案する。我々の手法は、深度、強度、レイドロップチャンネルを同時に再現することに成功し、公開可能な大規模シーンデータセットにおけるフレームレートと品質の両方のレンダリング結果を達成する。
論文参考訳（メタデータ） (2024-10-07T15:07:56Z)
V2X-VLM: End-to-End V2X Cooperative Autonomous Driving Through Large Vision-Language Models [13.716889927164383]
自動車間協力(V2X)は、古典的な自動運転の認識限界を克服するための有望なパラダイムとして浮上している。本稿では、視覚言語モデル(VLM)に基づく新しいエンドツーエンド(E2E)協調自動運転フレームワークであるV2X-VLMを紹介する。 V2X-VLMは、車両やインフラからの多視点カメラビューとテキストベースのシーン記述を統合し、運転環境のより包括的な理解を可能にする。
論文参考訳（メタデータ） (2024-08-17T16:42:13Z)
SFPNet: Sparse Focal Point Network for Semantic Segmentation on General LiDAR Point Clouds [13.097858142421519]
本稿では、ウィンドウアテンションをスパース焦点変調に置き換えることで、市場で広く普及している様々なLiDARに対応するためのフレームワークを提案する。我々のSFPNetは、複数のレベルのコンテキストを抽出し、ゲート機構を用いて動的に集約することができる。また,ロボットアプリケーションのための大規模ハイブリッド型LiDARセマンティックセマンティックセマンティックセマンティックデータセットについても紹介する。
論文参考訳（メタデータ） (2024-07-16T10:22:09Z)
V2I-Calib: A Novel Calibration Approach for Collaborative Vehicle and Infrastructure LiDAR Systems [19.919120489121987]
本稿では,V2Iキャリブレーションに新たなアプローチを導入し,知覚対象間の空間的関連情報を活用する。この手法の中心は、車両とインフラシステムによって識別されるターゲット間の相関を定量化する、イノベーティブなOIoU(Intersection over Union)計量である。当社のアプローチでは,親和性行列の構築を通じて,車両とインフラのLiDARシステムの認識結果における共通目標の同定を行う。
論文参考訳（メタデータ） (2024-07-14T13:34:00Z)
Talk to Parallel LiDARs: A Human-LiDAR Interaction Method Based on 3D Visual Grounding [16.01111155569546]
並列LiDARに3D視覚グラウンドタスクを導入し、LiDARシステムのための新しいヒューマン・コンピュータインタラクションパラダイムを提案する。本研究では,自律運転における3次元視覚的接地に適した大規模ベンチマークデータセットであるTalk2LiDARを提案する。 Talk2Car-3DおよびTalk2LiDARデータセットに関する実験は、BEVの優れた性能を示す。
論文参考訳（メタデータ） (2024-05-24T07:00:45Z)
V2X-ViT: Vehicle-to-Everything Cooperative Perception with Vision Transformer [58.71845618090022]
我々は、道路上のエージェント間で情報を融合するために、V2X-ViTという全体論的アテンションモデルを構築した。 V2X-ViTは異質なマルチエージェント自己アテンションとマルチスケールウィンドウ自己アテンションの交互層から構成される。我々のアプローチを検証するために、我々は大規模なV2X知覚データセットを作成します。
論文参考訳（メタデータ） (2022-03-20T20:18:25Z)
Self-Organizing mmWave MIMO Cell-Free Networks With Hybrid Beamforming: A Hierarchical DRL-Based Design [30.70798412145064]
セルフリー無線ネットワークにおいて、分散アクセスポイント(AP)は、同じ時間/周波数リソースを用いて、カバーエリア内のすべてのユーザ機器(UE)を共同で提供する。深層学習(DRL)に基づく複数のネットワーク分割を提案する。異なるセルフリーワーク間の干渉を設計するために,新しいハイブリッドビームストデジタルビームモデルを開発した。
論文参考訳（メタデータ） (2021-03-17T03:31:52Z)
LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文参考訳（メタデータ） (2020-11-24T08:44:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。