論文の概要: APR-Transformer: Initial Pose Estimation for Localization in Complex Environments through Absolute Pose Regression
- arxiv url: http://arxiv.org/abs/2505.09356v1
- Date: Wed, 14 May 2025 13:06:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.462311
- Title: APR-Transformer: Initial Pose Estimation for Localization in Complex Environments through Absolute Pose Regression
- Title(参考訳): APR変換器:絶対値回帰による複雑な環境における位置推定の初期値推定
- Authors: Srinivas Ravuri, Yuan Xu, Martin Ludwig Zehetner, Ketan Motlag, Sahin Albayrak,
- Abstract要約: 本稿では,最先端の手法に触発されたモデルアーキテクチャであるAPR-Transformerを紹介する。
提案手法は,確立したベンチマークデータセット上での最先端性能を実現する。
- 参考スコア(独自算出の注目度): 3.2584852202495806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Precise initialization plays a critical role in the performance of localization algorithms, especially in the context of robotics, autonomous driving, and computer vision. Poor localization accuracy is often a consequence of inaccurate initial poses, particularly noticeable in GNSS-denied environments where GPS signals are primarily relied upon for initialization. Recent advances in leveraging deep neural networks for pose regression have led to significant improvements in both accuracy and robustness, especially in estimating complex spatial relationships and orientations. In this paper, we introduce APR-Transformer, a model architecture inspired by state-of-the-art methods, which predicts absolute pose (3D position and 3D orientation) using either image or LiDAR data. We demonstrate that our proposed method achieves state-of-the-art performance on established benchmark datasets such as the Radar Oxford Robot-Car and DeepLoc datasets. Furthermore, we extend our experiments to include our custom complex APR-BeIntelli dataset. Additionally, we validate the reliability of our approach in GNSS-denied environments by deploying the model in real-time on an autonomous test vehicle. This showcases the practical feasibility and effectiveness of our approach. The source code is available at:https://github.com/GT-ARC/APR-Transformer.
- Abstract(参考訳): 精密初期化は、特にロボット工学、自律運転、コンピュータビジョンの文脈において、ローカライズアルゴリズムのパフォーマンスにおいて重要な役割を果たす。
ローカライゼーションの精度は不正確な初期ポーズの結果であり、特にGPS信号が主に初期化に頼っているGNSSの環境では顕著である。
深層ニューラルネットワークをポーズ回帰に活用する最近の進歩は、精度とロバスト性の両方、特に複雑な空間的関係と向きの推定において、大幅な改善をもたらした。
本稿では,画像とLiDARデータの両方を用いて絶対的なポーズ(3D位置と3D方向)を予測する,最先端手法にインスパイアされたモデルアーキテクチャであるAPR-Transformerを紹介する。
提案手法は,Radar Oxford Robot-CarやDeepLocといった,確立されたベンチマークデータセット上での最先端性能を実現する。
さらに、我々は実験を拡張し、独自のAPR-BeIntelliデータセットを含むようにします。
さらに,自律走行試験車にモデルをリアルタイムに配置することにより,GNSSによる環境下でのアプローチの信頼性を検証した。
これは我々のアプローチの実践的実現可能性と有効性を示すものである。
ソースコードはhttps://github.com/GT-ARC/APR-Transformer.comで公開されている。
関連論文リスト
- Pose Optimization for Autonomous Driving Datasets using Neural Rendering Models [18.517488388680096]
センサのポーズやキャリブレーションパラメータを改良するために,NeRF(Neural Radiance Fields)に基づくロバストな最適化手法を提案する。
本手法は,センサ・ポーズの精度を大幅に向上させることが実証された。
論文 参考訳(メタデータ) (2025-04-22T10:33:01Z) - 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - RING#: PR-by-PE Global Localization with Roto-translation Equivariant Gram Learning [20.688641105430467]
GPS信号が信頼できない場合、グローバルなローカライゼーションは自動運転やロボティクスの応用において不可欠である。
ほとんどのアプローチは、逐次位置認識(PR)とポーズ推定(PE)により、グローバルなローカライゼーションを実現する。
ポーズ推定から直接導出することで、別の場所認識の必要性を回避できる新しいパラダイムであるPR-by-PEローカライゼーションを導入する。
本稿では,鳥眼視(BEV)空間で動作する終端PR-by-PEローカライゼーションネットワークであるRING#を提案する。
論文 参考訳(メタデータ) (2024-08-30T18:42:53Z) - Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.10033984296247]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。
私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文 参考訳(メタデータ) (2024-07-22T12:32:09Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Benchmarking Visual-Inertial Deep Multimodal Fusion for Relative Pose
Regression and Odometry-aided Absolute Pose Regression [6.557612703872671]
視覚慣性ローカライゼーションは、仮想現実、自動運転車、航空機などのコンピュータビジョンやロボティクスアプリケーションにおいて重要な問題である。
本研究では,ポーズグラフの最適化とアテンションネットワークに基づく深層マルチモーダル融合の評価を行う。
本稿では,APR-RPRタスクの改善と,航空機やハンドヘルド機器のRPR-RPRタスクの改善について述べる。
論文 参考訳(メタデータ) (2022-08-01T15:05:26Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Denoising IMU Gyroscopes with Deep Learning for Open-Loop Attitude
Estimation [0.0]
本稿では,慣性計測ユニット(IMU)のジャイロスコープを地中真実データを用いて識別する学習手法を提案する。
得られたアルゴリズムは、(目に見えない)テストシーケンスで最先端の処理を行う。
論文 参考訳(メタデータ) (2020-02-25T08:04:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。