論文の概要: UNet-Based Keypoint Regression for 3D Cone Localization in Autonomous Racing
- arxiv url: http://arxiv.org/abs/2602.21904v1
- Date: Wed, 25 Feb 2026 13:34:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.845002
- Title: UNet-Based Keypoint Regression for 3D Cone Localization in Autonomous Racing
- Title(参考訳): 自律走行における3次元コーン位置定位のためのUNetに基づくキーポイント回帰
- Authors: Mariia Baidachna, James Carty, Aidan Ferguson, Joseph Agrane, Varad Kulkarni, Aubrey Agub, Michael Baxendale, Aaron David, Rachel Horton, Elliott Atkinson,
- Abstract要約: コーンのキーポイント検出のためのUNetベースのニューラルネットワークを提案する。
提案手法は,正確なコーン位置推定と色予測の可能性を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate cone localization in 3D space is essential in autonomous racing for precise navigation around the track. Approaches that rely on traditional computer vision algorithms are sensitive to environmental variations, and neural networks are often trained on limited data and are infeasible to run in real time. We present a UNet-based neural network for keypoint detection on cones, leveraging the largest custom-labeled dataset we have assembled. Our approach enables accurate cone position estimation and the potential for color prediction. Our model achieves substantial improvements in keypoint accuracy over conventional methods. Furthermore, we leverage our predicted keypoints in the perception pipeline and evaluate the end-to-end autonomous system. Our results show high-quality performance across all metrics, highlighting the effectiveness of this approach and its potential for adoption in competitive autonomous racing systems.
- Abstract(参考訳): 3次元空間における正確なコーン位置決めは、トラックの正確なナビゲーションに自律レースにおいて不可欠である。
従来のコンピュータビジョンアルゴリズムに依存するアプローチは環境の変化に敏感であり、ニューラルネットワークはしばしば限られたデータでトレーニングされ、リアルタイムに実行できない。
我々は、私たちが収集した最大のカスタムラベル付きデータセットを活用して、コーン上のキーポイント検出のためのUNetベースのニューラルネットワークを提案する。
提案手法は,正確なコーン位置推定と色予測の可能性を実現する。
従来の手法に比べてキーポイント精度が大幅に向上した。
さらに、認識パイプラインにおける予測キーポイントを活用し、エンドツーエンドの自律システムを評価する。
本研究の結果は,全指標にわたる高品質な性能を示し,このアプローチの有効性と,競争力のある自律レースシステムへの導入の可能性を強調した。
関連論文リスト
- Real-Time 3D Object Detection with Inference-Aligned Learning [20.94871746774727]
ポイントクラウドからのリアルタイム3Dオブジェクト検出は、拡張現実、ロボット工学、ナビゲーションなどのアプリケーションにおける動的なシーン理解に不可欠である。
本稿では,検出器の訓練方法と評価方法のギャップを埋めるために,空間優先・ランク対応の3Dオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-20T08:27:00Z) - A Lightweight 3D-CNN for Event-Based Human Action Recognition with Privacy-Preserving Potential [3.232011096928682]
本稿では,事象に基づく視覚データを用いた人間行動認識のための軽量な3次元畳み込みニューラルネットワーク(3DCNN)を提案する。
結果、F1スコアは0.9415で、全体的な精度は94.17%で、ベンチマーク3D-CNNアーキテクチャを上回った。
論文 参考訳(メタデータ) (2025-11-05T17:30:31Z) - Predictive Uncertainty for Runtime Assurance of a Real-Time Computer Vision-Based Landing System [32.06417142452719]
滑走路画像から航空機のポーズ推定を行うためのビジョンベースパイプラインを提案する。
提案手法は,確率的キーポイント回帰のための空間的ソフトArgmax演算子をベースとした,効率的なフレキシブルなニューラルアーキテクチャ,リアルタイム推論による多様なビジョンバックボーンのサポート,および,シャープネスとキャリブレーションの指標によって評価される予測不確実性を生成する原理的損失関数,および (iii) 実行時検出と故障モデル出力の拒否を可能にするResidual-based Receiver Self Integrity Monitoring (RAIM) の適応である。
論文 参考訳(メタデータ) (2025-08-13T11:56:22Z) - APR-Transformer: Initial Pose Estimation for Localization in Complex Environments through Absolute Pose Regression [3.2584852202495806]
本稿では,最先端の手法に触発されたモデルアーキテクチャであるAPR-Transformerを紹介する。
提案手法は,確立したベンチマークデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2025-05-14T13:06:42Z) - Interpretable Self-Aware Neural Networks for Robust Trajectory
Prediction [50.79827516897913]
本稿では,意味概念間で不確実性を分散する軌道予測のための解釈可能なパラダイムを提案する。
実世界の自動運転データに対する我々のアプローチを検証し、最先端のベースラインよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-16T06:28:20Z) - ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal
Feature Learning [132.20119288212376]
本稿では,認識,予測,計画タスクを同時に行うための,より代表的な特徴の集合に対する時空間的特徴学習手法を提案する。
私たちの知識を最大限に活用するために、私たちは、解釈可能なエンドツーエンドの自動運転システムの各部分を体系的に調査した最初の人です。
論文 参考訳(メタデータ) (2022-07-15T16:57:43Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Efficient and Robust LiDAR-Based End-to-End Navigation [132.52661670308606]
我々は,LiDARをベースとした効率的なエンドツーエンドナビゲーションフレームワークを提案する。
本稿では,スパース畳み込みカーネル最適化とハードウェア対応モデル設計に基づくFast-LiDARNetを提案する。
次に,単一の前方通過のみから予測の不確かさを直接推定するハイブリッド・エビデンシャル・フュージョンを提案する。
論文 参考訳(メタデータ) (2021-05-20T17:52:37Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。