論文の概要: LIE: LiDAR-only HD Map Construction with Intensity Enhancement via Online Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2605.01478v1
- Date: Sat, 02 May 2026 14:52:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.793298
- Title: LIE: LiDAR-only HD Map Construction with Intensity Enhancement via Online Knowledge Distillation
- Title(参考訳): LIE:LiDARのみのHDマップ構築とオンライン知識蒸留による強度向上
- Authors: Kanak Mazumder, Fabian B. Flohr,
- Abstract要約: オンラインハイディフィニション(HD)マップ構築は自動運転の重要な要素である。
近年の手法では、コスト効率のよいHDマップセグメンテーションのためのマルチビューカメラ画像に頼っているが、カメラには正確なシーン形状の深度情報がない。
本研究では,知識蒸留(KD)を用いたLIE(LDARのみの意味マップ構築法)を提案する。
- 参考スコア(独自算出の注目度): 0.3265773263570237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online High-Definition (HD) map construction is a key component of autonomous driving. Recent methods rely on multi-view camera images for cost-effective HD map segmentation, but cameras lack depth information for accurate scene geometry. In contrast, LiDAR provides precise 3D measurements but lacks dense semantic cues. In this work, we propose LIE, LiDAR-only semantic map construction method that employ Knowledge Distillation (KD) to handle the lack of dense semantic and texture cues. Specifically, the teacher branch fuses student LiDAR features and the corresponding 2D intensity map tile to provide dense supervision for segmenting map elements using online distillation scheme. Experimental results show that our method outperforms all single-modality approaches, achieving 8.2% higher mIoU than the state-of-the-art camera-based model on nuScenes. LIE is robust over long ranges and under challenging weather and lighting, and efficiently adapts to Argoverse2 with only 10% fine-tuning, surpassing camera-based models trained on the full dataset. Source code will be available \href{https://iv.ee.hm.edu/lie/}{here}.
- Abstract(参考訳): オンラインハイディフィニション(HD)マップ構築は自動運転の重要な要素である。
近年の手法では、コスト効率のよいHDマップセグメンテーションのためのマルチビューカメラ画像に頼っているが、カメラには正確なシーン形状の深度情報がない。
対照的に、LiDARは正確な3D計測を提供するが、密接なセマンティック・キューは欠如している。
本研究では,知識蒸留(KD)を用いたLIE(LDARのみの意味マップ構築法)を提案する。
具体的には、教師ブランチは、学生LiDAR特徴とそれに対応する2D強度マップタイルを融合させ、オンライン蒸留方式を用いて地図要素のセグメンテーションを行うための密集した監督を提供する。
実験結果から,本手法は, nuScenesのカメラベースモデルよりも8.2%高いmIoUを達成し, 単一モダリティのアプローチに優れることがわかった。
LIEは、長期にわたって堅牢で、厳しい天候と照明の下で、完全なデータセットでトレーニングされたカメラベースのモデルを上回る10%の微調整で、Argoverse2に効率的に適応する。
ソースコードは \href{https://iv.ee.hm.edu/lie/}{here} で入手できる。
関連論文リスト
- MapKD: Unlocking Prior Knowledge with Cross-Modal Distillation for Efficient Online HD Map Construction [23.156125781601528]
MapKDは、革新的なTeach-Coach-Student(TCS)パラダイムを備えた、多段階のクロスモーダルな知識蒸留フレームワークである。
本稿では,鳥の目視機能アライメントのためのToken-Guided 2D Patch Distillation (TGPD) と,意味学習指導のためのMasked Semantic Response Distillation (MSRD) の2つを紹介する。
挑戦的なnuScenesデータセットの実験では、MapKDは推論速度を同時に加速しながら、+6.68 mIoUと+10.94 mAPの学生モデルを改善することが示されている。
論文 参考訳(メタデータ) (2025-08-21T15:37:18Z) - MapDistill: Boosting Efficient Camera-based HD Map Construction via Camera-LiDAR Fusion Model Distillation [13.057096630912952]
我々は,KD(Knowledge Distillation)というアイデアを初めて,効率的なHDマップ構築に利用した。
我々は、高性能カメラ-LiDAR融合モデルから軽量カメラ専用モデルへ知識を伝達する、MapDistillと呼ばれる新しいKDベースのアプローチを導入する。
論文 参考訳(メタデータ) (2024-07-16T13:00:20Z) - Language-Guided 3D Object Detection in Point Cloud for Autonomous
Driving [91.91552963872596]
我々は,LiDARグラウンディングと呼ばれるマルチモーダルな視覚的グラウンドニングタスクを提案する。
言語特徴を持つLiDARベースの物体検出器を共同で学習し、検出器から直接対象領域を予測する。
私たちの研究は、LiDARベースの接地作業に関する深い洞察を提供しており、自動運転コミュニティにとって有望な方向性を示すものと期待しています。
論文 参考訳(メタデータ) (2023-05-25T06:22:10Z) - LiDAR2Map: In Defense of LiDAR-Based Semantic Map Construction Using
Online Camera Distillation [21.53150795218778]
鳥眼ビュー(BEV)の下でのセマンティックマップの構築は、自律運転において重要な役割を担っている。
本稿では,LiDARを用いたセマンティックマップ構築手法を提案する。
セマンティックマップ構築のための堅牢なマルチスケールBEV特徴を学習するBEV機能ピラミッドデコーダを導入する。
論文 参考訳(メタデータ) (2023-04-22T12:05:29Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - Gait Recognition in Large-scale Free Environment via Single LiDAR [35.684257181154905]
深度を捉えるLiDARの能力は、ロボットの知覚にとって重要な要素であり、現実世界の歩行認識の可能性を秘めている。
本稿では,頑健な歩行認識のための階層型多表現特徴相互作用ネットワーク(HMRNet)を提案する。
LiDARに基づく歩行認識研究を容易にするため,大規模かつ制約のない歩行データセットであるFreeGaitを紹介した。
論文 参考訳(メタデータ) (2022-11-22T16:05:58Z) - MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。
得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。
実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:21:41Z) - Multi-modal 3D Human Pose Estimation with 2D Weak Supervision in
Autonomous Driving [74.74519047735916]
自動運転車(AV)における3次元ポーズ推定(HPE)は,多くの要因において他のユースケースと異なる。
他のユースケース(仮想現実、ゲーム、アニメーションなど)のために収集されたデータは、AVアプリケーションには使用できない可能性がある。
本稿では,この問題をAV設定で緩和するための最初のアプローチの1つを提案する。
論文 参考訳(メタデータ) (2021-12-22T18:57:16Z) - HDNET: Exploiting HD Maps for 3D Object Detection [99.49035895393934]
高精細度(hd)マップは、現代の3dオブジェクト検出器の性能と頑健性を高める強力な事前情報を提供する。
我々はHDマップから幾何学的特徴と意味的特徴を抽出する単一ステージ検出器を設計する。
地図は至る所では利用できないため、生のLiDARデータからフライ時の地図を推定するマップ予測モジュールも提案する。
論文 参考訳(メタデータ) (2020-12-21T21:59:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。