論文の概要: Gamma-from-Mono: Road-Relative, Metric, Self-Supervised Monocular Geometry for Vehicular Applications
- arxiv url: http://arxiv.org/abs/2512.04303v1
- Date: Wed, 03 Dec 2025 22:37:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.908601
- Title: Gamma-from-Mono: Road-Relative, Metric, Self-Supervised Monocular Geometry for Vehicular Applications
- Title(参考訳): Gamma-from-Mono: 車両用道路関連, 計量, 自己監督単分子幾何学
- Authors: Gasser Elazab, Maximilian Jansen, Michael Unterreiner, Olaf Hellwich,
- Abstract要約: 本稿では,軽量な単分子幾何推定法であるGamma-from-Mono (GfM)を紹介する。
GfMはガンマで表される残差とともに支配的な道路面を予測する。
地上のカメラの高さだけで、GfMは決定論的に閉じた形を通してメートル法的な深さを回復する。
- 参考スコア(独自算出の注目度): 2.9457242478147503
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Accurate perception of the vehicle's 3D surroundings, including fine-scale road geometry, such as bumps, slopes, and surface irregularities, is essential for safe and comfortable vehicle control. However, conventional monocular depth estimation often oversmooths these features, losing critical information for motion planning and stability. To address this, we introduce Gamma-from-Mono (GfM), a lightweight monocular geometry estimation method that resolves the projective ambiguity in single-camera reconstruction by decoupling global and local structure. GfM predicts a dominant road surface plane together with residual variations expressed by gamma, a dimensionless measure of vertical deviation from the plane, defined as the ratio of a point's height above it to its depth from the camera, and grounded in established planar parallax geometry. With only the camera's height above ground, this representation deterministically recovers metric depth via a closed form, avoiding full extrinsic calibration and naturally prioritizing near-road detail. Its physically interpretable formulation makes it well suited for self-supervised learning, eliminating the need for large annotated datasets. Evaluated on KITTI and the Road Surface Reconstruction Dataset (RSRD), GfM achieves state-of-the-art near-field accuracy in both depth and gamma estimation while maintaining competitive global depth performance. Our lightweight 8.88M-parameter model adapts robustly across diverse camera setups and, to our knowledge, is the first self-supervised monocular approach evaluated on RSRD.
- Abstract(参考訳): 車両の3D環境の正確な認識には、バンプ、斜面、表面の凹凸といった細かな道路形状が含まれており、安全で快適な車両制御には不可欠である。
しかし、従来の単分子深度推定はこれらの特徴を過度に上回り、運動計画と安定性にとって重要な情報を失う。
これを解決するために,Gamma-from-Mono (GfM) を導入し,グローバル構造と局所構造を分離することにより,単一カメラ再構成における射影の曖昧さを解消する軽量な単分子形状推定法を提案する。
GfMは、ガンマで表される残差とともに支配的な道路面を予測し、平面からの垂直偏差を次元的に測定し、その上の点の高さとカメラからの深さの比として定義し、確立された平面視差幾何学で接地する。
地上のカメラの高さだけで、この表現は閉じた形によってメートル法的な深さを決定的に回復し、完全な外在的な校正を回避し、近道の詳細を自然に優先順位付けする。
物理的に解釈可能な定式化によって、大規模な注釈付きデータセットの必要性を排除し、自己教師付き学習に適している。
KITTIと道路表面再構成データセット(RSRD)に基づいて、GfMは、競争力のある世界深度性能を維持しながら、深度とガンマ推定の両方において最先端の近接場精度を達成する。
当社の軽量888Mパラメータモデルは多様なカメラ設定に頑健に適応し、我々の知る限り、RSRDで評価された初めての自己監督単眼的アプローチである。
関連論文リスト
- MCGS-SLAM: A Multi-Camera SLAM Framework Using Gaussian Splatting for High-Fidelity Mapping [52.99503784067417]
3次元ガウス平板上に構築した初のRGBベースのマルチカメラSLAMシステムMCGS-SLAM(3DGS)を提案する。
マルチカメラバンドル調整(MCBA)は、高密度の測光および幾何残差を介してポーズと深さを共同で洗練し、スケール整合モジュールはビューを横断する計量アライメントを強制する。
合成および実世界のデータセットの実験は、MCGS-SLAMが一貫して正確な軌道と光現実的再構成をもたらすことを示している。
論文 参考訳(メタデータ) (2025-09-17T17:27:53Z) - Gaussian Alignment for Relative Camera Pose Estimation via Single-View Reconstruction [18.936573991468926]
GARPSは、2つの独立して再構成された3Dシーンの直接的なアライメントとしてこの問題を論じる、トレーニング不要のフレームワークである。
差分可能なGMMアライメント目標を最適化することにより、フィードフォワード2ビューポーズ推定器の初期ポーズを洗練する。
Real-Estate10Kデータセットの実験では、GARPSが古典的および最先端の学習ベースの手法よりも優れていることが示されている。
論文 参考訳(メタデータ) (2025-09-17T02:57:34Z) - Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文 参考訳(メタデータ) (2025-09-11T18:52:16Z) - Zero-Shot Metric Depth Estimation via Monocular Visual-Inertial Rescaling for Autonomous Aerial Navigation [6.996435353737172]
本稿では,単分子RGB画像と慣性測定ユニット(IMU)から距離深度を予測する手法を提案する。
スパース3次元特徴写像を用いて相対深度推定から距離深度を求めるための軽量ゼロショット再スケーリング手法を提案する。
提案手法を移動プリミティブベースプランナと統合した後, 衝突回避効果を示す。
論文 参考訳(メタデータ) (2025-09-09T21:39:13Z) - DashCam Video: A complementary low-cost data stream for on-demand forest-infrastructure system monitoring [1.6064410860203764]
本研究では,道路沿いの植生・インフラのリアルタイム・オブジェクトレベルの構造評価と位置決めのための,新しい,低コスト・再現可能なフレームワークを提案する。
車両搭載ダッシュカムから正確な空間的・構造的データを生成するために,単眼深度推定,深度誤差補正,幾何三角法を組み合わせたエンドツーエンドパイプラインを開発した。
提案手法は, 植生リスクとインフラ露出のオブジェクトレベルのモニタリングを行うための, 高速でリアルタイムかつ費用対効果の高いソリューションを提供することにより, LiDARや画像などの従来のRS手法を補完するものである。
論文 参考訳(メタデータ) (2025-08-15T16:55:12Z) - GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion [0.0]
計量単分子深度推定の一般化は、その不適切な性質のために重要な課題となる。
本稿では,様々なカメラ設定の整合性を維持する新しい標準表現を提案する。
また,物体の大きさや垂直位置の手がかりによって推定される深度を適応的かつ確率的に融合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-12-08T22:04:34Z) - W-HMR: Monocular Human Mesh Recovery in World Space with Weak-Supervised Calibration [57.37135310143126]
モノクロ画像からの3次元運動回復のための従来の手法は、カメラ座標に依存するため、しばしば不足する。
W-HMRは、身体の歪み情報に基づいて「適切な」焦点長を予測する弱教師付き校正法である。
また,世界空間における可視的再構築のために,身体の向きを補正する OrientCorrect モジュールを提案する。
論文 参考訳(メタデータ) (2023-11-29T09:02:07Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。