論文の概要: Mind the Hitch: Dynamic Calibration and Articulated Perception for Autonomous Trucks
- arxiv url: http://arxiv.org/abs/2603.23711v1
- Date: Tue, 24 Mar 2026 20:55:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.023084
- Title: Mind the Hitch: Dynamic Calibration and Articulated Perception for Autonomous Trucks
- Title(参考訳): Mind the Hitch: 自律トラックの動的校正とArticulated Perception
- Authors: Morui Zhu, Yongqi Zhu, Song Fu, Qing Yang,
- Abstract要約: dCAPは、トラクタとトレーラーカメラの間の6自由度(自由度)の相対的なポーズを継続的に推定するビジョンベースのフレームワークである。
BEVFormerと統合されたdCAPは、静的キャリブレーションを動的に予測外在物に置き換えることで、3Dオブジェクトの検出を改善する。
実験では、自律トラックにおける静的キャリブレーションの限界に対処しながら、dCAPが安定かつ正確な知覚を達成することを示した。
- 参考スコア(独自算出の注目度): 7.0536813329377
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous trucking poses unique challenges due to articulated tractor-trailer geometry, and time-varying sensor poses caused by the fifth-wheel joint and trailer flex. Existing perception and calibration methods assume static baselines or rely on high-parallax and texture-rich scenes, limiting their reliability under real-world settings. We propose dCAP (dynamic Calibration and Articulated Perception), a vision-based framework that continuously estimates the 6-DoF (degree of freedom) relative pose between tractor and trailer cameras. dCAP employs a transformer with cross-view and temporal attention to robustly aggregate spatial cues while maintaining temporal consistency, enabling accurate perception under rapid articulation and occlusion. Integrated with BEVFormer, dCAP improves 3D object detection by replacing static calibration with dynamically predicted extrinsics. To facilitate evaluation, we introduce STT4AT, a CARLA-based benchmark simulating semi-trailer trucks with synchronized multi-sensor suites and time-varying inter-rig geometry across diverse environments. Experiments demonstrate that dCAP achieves stable, accurate perception while addressing the limitations of static calibration in autonomous trucking. The dataset, development kit, and source code will be publicly released.
- Abstract(参考訳): 自動トラックはトラクタ・トレーラーの形状と、第5車輪の関節とトレーラーの屈曲によって引き起こされる時間変化センサーのポーズによって、独特な課題を生んでいる。
既存の知覚と校正法は静的なベースラインを前提とするか、高パララックスとテクスチャに富んだシーンに依存し、現実の環境での信頼性を制限している。
トラクタとトレーラーカメラ間の6自由度(自由度)相対的なポーズを連続的に推定する視覚ベースのフレームワークであるdCAP(dynamic Calibration and Articulated Perception)を提案する。
dCAPは、時間的一貫性を維持しながら空間的手がかりを頑健に集約し、迅速な調音と閉塞の下で正確な知覚を可能にする。
BEVFormerと統合されたdCAPは、静的キャリブレーションを動的に予測外在物に置き換えることで、3Dオブジェクトの検出を改善する。
評価を容易にするため,CARLAをベースとしたセミトレーラトラックを模擬したベンチマークであるSTT4ATを導入する。
実験では、自律トラックにおける静的キャリブレーションの限界に対処しながら、dCAPが安定かつ正確な知覚を達成することを示した。
データセット、開発キット、ソースコードが公開される。
関連論文リスト
- Model Optimization for Multi-Camera 3D Detection and Tracking [13.756560739163362]
室内環境におけるマルチカメラの外部認識の重要性はますます高まっている。
クエリベースの3D検出・追跡フレームワークであるSparse4Dを評価した。
我々は,入力フレームレートの低減,学習後の量子化,WILDTRACKベンチマークへの転送,およびトランスフォーマーエンジンの混合精度の微調整について検討した。
論文 参考訳(メタデータ) (2026-01-31T01:51:30Z) - Delving into Dynamic Scene Cue-Consistency for Robust 3D Multi-Object Tracking [16.366398265001422]
3D多目的追跡は、自動運転分野において重要かつ困難な課題である。
本稿では,この原理を実現するために動的シーンCue-Consistency Tracker(DSC-Track)を提案する。
論文 参考訳(メタデータ) (2025-08-15T08:48:13Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - MTGS: Multi-Traversal Gaussian Splatting [51.22657444433942]
マルチトラバースデータは、道路ブロック内のシーン再構築のための複数の視点を提供する。
任意に収集したマルチトラバーサルデータから高品質な運転シーンを再構成する新しい手法であるマルチトラバーサル・ガウス・スプラッティング(MTGS)を提案する。
その結果、MTGSはLPIPSを23.5%改善し、幾何学的精度は46.3%向上した。
論文 参考訳(メタデータ) (2025-03-16T15:46:12Z) - Universal Online Temporal Calibration for Optimization-based Visual-Inertial Navigation Systems [13.416013522770905]
最適化に基づくビジュアル慣性ナビゲーションシステムのための汎用的なオンライン時間的キャリブレーション戦略を提案する。
我々は、最適化残差モデルにおいて、タイムオフセットtdを状態パラメータとして使用し、IMU状態を対応する画像のタイムスタンプに整列させる。
我々のアプローチは、特にノイズの多いセンサデータの存在下で、より正確な時間オフセット推定とより高速な収束を提供する。
論文 参考訳(メタデータ) (2025-01-03T12:41:25Z) - LiDAR-based End-to-end Temporal Perception for Vehicle-Infrastructure Cooperation [16.465037559349323]
LET-VICはLiDARをベースとした車両・インフラ協調のためのエンド・ツー・エンドトラッキングフレームワークである。
車両とインフラの両面から時間的・空間的な情報を統合するために,時間的自己認識モジュールとVICクロスアテンションモジュールを用いている。
実験により、エンドツーエンドトレーニングにおける多視点視点、時間シーケンス、またはCECの統合は、検出と追跡の両方のパフォーマンスを著しく改善することが示された。
論文 参考訳(メタデータ) (2024-11-22T13:34:29Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。