論文の概要: Cross-Vehicle 3D Geometric Consistency for Self-Supervised Surround Depth Estimation on Articulated Vehicles
- arxiv url: http://arxiv.org/abs/2604.02639v1
- Date: Fri, 03 Apr 2026 02:10:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.276184
- Title: Cross-Vehicle 3D Geometric Consistency for Self-Supervised Surround Depth Estimation on Articulated Vehicles
- Title(参考訳): 人工車両の自己監督下地深度推定のためのクロスサイクル3次元幾何学的整合性
- Authors: Weimin Liu, Jiyuan Qiu, Wenjun Wang, Joshua H. Meng,
- Abstract要約: そこで本研究では,車体の周囲視深度推定のための自己教師型フレームワークを提案する。
構造コヒーレンスを改善するために,多視点空間拡張戦略とクロスビュー表面正規制約を導入する。
提案手法を検証するために,その上で収集したデータセットを用いて車載実験プラットフォームを構築した。
- 参考スコア(独自算出の注目度): 3.512352303010361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Surround depth estimation provides a cost-effective alternative to LiDAR for 3D perception in autonomous driving. While recent self-supervised methods explore multi-camera settings to improve scale awareness and scene coverage, they are primarily designed for passenger vehicles and rarely consider articulated vehicles or robotics platforms. The articulated structure introduces complex cross-segment geometry and motion coupling, making consistent depth reasoning across views more challenging. In this work, we propose \textbf{ArticuSurDepth}, a self-supervised framework for surround-view depth estimation on articulated vehicles that enhances depth learning through cross-view and cross-vehicle geometric consistency guided by structural priors from vision foundation model. Specifically, we introduce multi-view spatial context enrichment strategy and a cross-view surface normal constraint to improve structural coherence across spatial and temporal contexts. We further incorporate camera height regularization with ground plane-awareness to encourage metric depth estimation, together with cross-vehicle pose consistency that bridges motion estimation between articulated segments. To validate our proposed method, an articulated vehicle experiment platform was established with a dataset collected over it. Experiment results demonstrate state-of-the-art (SoTA) performance of depth estimation on our self-collected dataset as well as on DDAD, nuScenes, and KITTI benchmarks.
- Abstract(参考訳): 周深度推定は、自動運転における3次元認識のためのLiDARに代わる費用対効果を提供する。
最近の自己監督的手法は、スケールの認識とシーンのカバレッジを改善するためにマルチカメラ設定を探索するが、それらは主に旅客車両用に設計されており、関節車やロボットプラットフォームをめったに考慮しない。
明瞭な構造は複雑な断面幾何学と運動結合を導入し、ビュー間の一貫した深度推論をより困難にする。
本研究では,視覚基盤モデルから導かれる構造的先行性によって導かれるクロスビューおよびクロス車両の幾何的整合性を通じて深度学習を向上する,関節車上でのサラウンドビュー深度推定のための自己教師型フレームワークである「textbf{ArticuSurDepth}」を提案する。
具体的には、空間的および時間的コンテキスト間の構造的コヒーレンスを改善するために、多視点空間的エンリッチメント戦略とクロスビュー表面正規制約を導入する。
さらに、地上面認識によるカメラ高さの正則化を取り入れ、距離深度推定を奨励し、車間ポーズの一貫性を保ち、セグメント間の動き推定を橋渡しする。
提案手法を検証するために,その上で収集したデータセットを用いて車載実験プラットフォームを構築した。
実験結果は、DDAD、nuScenes、KITTIベンチマークと同様に、自己コンパイルしたデータセットの深さ推定の最先端(SoTA)性能を示す。
関連論文リスト
- GeoSurDepth: Spatial Geometry-Consistent Self-Supervised Depth Estimation for Surround-View Cameras [3.072321170197384]
GeoSurDepthは、サラウンドビューの深さ推定のための主要なキューとして、幾何整合性を利用するフレームワークである。
筆者らのフレームワークは,頑健な自己教師付き多視点深度推定のための幾何学的コヒーレンスと一貫性を活用することの重要性を強調した。
論文 参考訳(メタデータ) (2026-01-09T15:13:28Z) - 3DTTNet: Multimodal Fusion-Based 3D Traversable Terrain Modeling for Off-Road Environments [10.521569910467072]
オフロード環境は、自動運転車にとって重要な課題である。
本稿では,セマンティックシーンの完了によって,横断可能な領域認識を実現する。
3DTTNetと呼ばれる新しいマルチモーダル手法が提案されている。
論文 参考訳(メタデータ) (2024-12-11T08:36:36Z) - Pixel to Elevation: Learning to Predict Elevation Maps at Long Range using Images for Autonomous Offroad Navigation [10.898724668444125]
本稿では,車載エゴセントリック画像のみをリアルタイムに利用して,長距離の地形標高マップを予測できる学習型アプローチを提案する。
複雑で非構造的な地形における自律型オフロードロボットナビゲーションへの提案手法の適用性を実験的に検証した。
論文 参考訳(メタデータ) (2024-01-30T22:37:24Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。