論文の概要: HypLiLoc: Towards Effective LiDAR Pose Regression with Hyperbolic Fusion
- arxiv url: http://arxiv.org/abs/2304.00932v1
- Date: Mon, 3 Apr 2023 12:43:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 15:41:16.686247
- Title: HypLiLoc: Towards Effective LiDAR Pose Regression with Hyperbolic Fusion
- Title(参考訳): HypLiLoc: ハイパーボリック核融合によるLiDARの効率的な回帰を目指して
- Authors: Sijie Wang, Qiyu Kang, Rui She, Wei Wang, Kai Zhao, Yang Song, Wee
Peng Tay
- Abstract要約: 我々は、LiDARポーズ回帰の新しいモデルであるHypLiLocを提案する。
2つの分岐したバックボーンを用いて3次元特徴と2次元投影特徴を抽出する。
実験結果から,HypLiLocは屋外および屋内の両方のデータセットで最先端の性能を達成することが示された。
- 参考スコア(独自算出の注目度): 33.83142752202624
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LiDAR relocalization plays a crucial role in many fields, including robotics,
autonomous driving, and computer vision. LiDAR-based retrieval from a database
typically incurs high computation storage costs and can lead to globally
inaccurate pose estimations if the database is too sparse. On the other hand,
pose regression methods take images or point clouds as inputs and directly
regress global poses in an end-to-end manner. They do not perform database
matching and are more computationally efficient than retrieval techniques. We
propose HypLiLoc, a new model for LiDAR pose regression. We use two branched
backbones to extract 3D features and 2D projection features, respectively. We
consider multi-modal feature fusion in both Euclidean and hyperbolic spaces to
obtain more effective feature representations. Experimental results indicate
that HypLiLoc achieves state-of-the-art performance in both outdoor and indoor
datasets. We also conduct extensive ablation studies on the framework design,
which demonstrate the effectiveness of multi-modal feature extraction and
multi-space embedding. Our code is released at:
https://github.com/sijieaaa/HypLiLoc
- Abstract(参考訳): LiDARの再ローカライゼーションは、ロボット工学、自律運転、コンピュータビジョンなど、多くの分野で重要な役割を果たしている。
データベースからのLiDARベースの検索は、通常、高い計算ストレージコストを発生させ、データベースがスパースすぎる場合、世界中の不正確なポーズ推定につながる可能性がある。
一方、ポーズ回帰手法では、画像や雲を入力として捉え、エンドツーエンドでグローバルポーズを直接レグレッションする。
データベースマッチングは行わず、検索技術よりも計算効率が高い。
我々は、LiDARポーズ回帰の新しいモデルであるHypLiLocを提案する。
2つの分岐したバックボーンを用いてそれぞれ3次元特徴と2次元投影特徴を抽出する。
より効率的な特徴表現を得るために,ユークリッド空間と双曲空間のマルチモーダル特徴融合を考える。
実験結果から,HypLiLocは屋外および屋内の両方のデータセットで最先端の性能を達成することが示された。
また,マルチモーダル特徴抽出とマルチスペース埋め込みの有効性を示すフレームワーク設計に関する広範なアブレーション研究を行う。
私たちのコードは、https://github.com/sijieaaa/HypLiLocでリリースされています。
関連論文リスト
- LiOn-XA: Unsupervised Domain Adaptation via LiDAR-Only Cross-Modal Adversarial Training [61.26381389532653]
LiOn-XAは、LiDAR-Only Cross-Modal (X)学習と3D LiDARポイントクラウドセマンティックセマンティックセグメンテーションのためのAdversarial Trainingを組み合わせた、教師なしドメイン適応(UDA)アプローチである。
3つの現実的適応シナリオに関する実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2024-10-21T09:50:17Z) - Generalized Regression with Conditional GANs [2.4171019220503402]
本稿では,学習データセットにおける特徴ラベルペアと,対応する入力と組み合わせて出力を区別できない予測関数を学習することを提案する。
回帰に対するこのアプローチは、私たちが適合するデータの分布に対する仮定を減らし、表現能力が向上することを示す。
論文 参考訳(メタデータ) (2024-04-21T01:27:47Z) - Just Add $100 More: Augmenting NeRF-based Pseudo-LiDAR Point Cloud for Resolving Class-imbalance Problem [12.26293873825084]
本稿では,小クラスのミニチュアや現実世界のオブジェクトのサラウンドビューをキャプチャしたビデオから生成された擬似LiDAR点雲を活用することを提案する。
Pseudo Ground Truth Aug (PGT-Aug) と呼ばれるこの手法は, (i) 2D-to-3Dビュー合成モデルを用いたボリューム3Dインスタンス再構成, (ii)LiDAR強度推定によるオブジェクトレベルドメインアライメント, (iii) 地上情報と地図情報からのコンテキスト認識配置のハイブリッド化という3つのステップから構成される。
論文 参考訳(メタデータ) (2024-03-18T08:50:04Z) - Multimodal Learned Sparse Retrieval with Probabilistic Expansion Control [66.78146440275093]
学習検索(LSR)は、クエリとドキュメントを疎語彙ベクトルにエンコードするニューラルネットワークのファミリーである。
テキスト画像検索に焦点をあて,マルチモーダル領域へのLSRの適用について検討する。
LexLIPやSTAIRのような現在のアプローチでは、大規模なデータセットで複雑なマルチステップのトレーニングが必要です。
提案手法は, 密度ベクトルを凍結密度モデルからスパース語彙ベクトルへ効率的に変換する。
論文 参考訳(メタデータ) (2024-02-27T14:21:56Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Drone Referring Localization: An Efficient Heterogeneous Spatial Feature Interaction Method For UAV Self-Localization [22.94589565476653]
我々は、Drone Referring Localization(DRL)と呼ばれる、効率的な異種空間特徴相互作用法を提案する。
異なるデータソースを分離して扱う従来の方法とは異なり、DRLは異種特徴の学習可能な相互作用を促進する。
従来のIR法と比較して、DRLはより優れたローカライズ精度(MA@20 + 9.4%)を実現し、計算時間(1/7)とストレージオーバーヘッド(2/3)を大幅に削減した。
論文 参考訳(メタデータ) (2022-08-13T03:25:50Z) - LiDAR-aid Inertial Poser: Large-scale Human Motion Capture by Sparse
Inertial and LiDAR Sensors [38.60837840737258]
本研究では,大規模なシナリオにおいて,高精度な局所的なポーズとグローバルな軌跡を持つ3次元人間の動きを捉えるためのマルチセンサ融合法を提案する。
我々は,2段階のポーズ推定器を粗大な方法で設計し,そこでは点雲が粗大な体形状を提供し,IMU測定は局所的な動作を最適化する。
我々は,LiDAR-IMUマルチモーダルモキャップデータセット(LIPD)を長期シナリオで収集する。
論文 参考訳(メタデータ) (2022-05-30T20:15:11Z) - Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object
Detection [58.81316192862618]
自律運転における3D知覚のための2つの重要なセンサーは、カメラとLiDARである。
これら2つのモダリティを融合させることで、3次元知覚モデルの性能を大幅に向上させることができる。
我々は、最先端の核融合法を初めてベンチマークした。
論文 参考訳(メタデータ) (2022-05-30T09:35:37Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Generative Feature Replay with Orthogonal Weight Modification for
Continual Learning [20.8966035274874]
生成的再生は、破滅的な忘れを和らげるために、以前のタスクの擬似データを生成し再生する有望な戦略である。
生成モデルを用いて垂直層の特徴を再現することを提案する; 2) 自己監督型補助タスクを活用して特徴の安定性をさらに向上する。
いくつかのデータセットにおける実験結果から,我々の手法は常に強力なOWMよりも大幅に改善されていることが分かる。
論文 参考訳(メタデータ) (2020-05-07T13:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。