論文の概要: Typography-Based Monocular Distance Estimation Framework for Vehicle Safety Systems
- arxiv url: http://arxiv.org/abs/2603.22781v1
- Date: Tue, 24 Mar 2026 04:18:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.298872
- Title: Typography-Based Monocular Distance Estimation Framework for Vehicle Safety Systems
- Title(参考訳): 自動車安全システムのためのタイポグラフィーに基づく単眼距離推定フレームワーク
- Authors: Manognya Lokesh Reddy, Zheng Liu,
- Abstract要約: 本稿では,タイポグラフィに基づく単分子距離推定フレームワークを提案する。
これは、メートル法距離推定のためのパッシブ・フィデューシャル・マーカーとして、ナンバープレートの標準化されたタイポグラフィを利用する。
プレート幅法を総合的に比較すると,文字ベースの測度は推定値の標準偏差を35%減少させる。
- 参考スコア(独自算出の注目度): 4.601043621601829
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate inter-vehicle distance estimation is a cornerstone of advanced driver assistance systems and autonomous driving. While LiDAR and radar provide high precision, their cost prohibits widespread adoption in mass-market vehicles. Monocular vision offers a low-cost alternative but suffers from scale ambiguity and sensitivity to environmental disturbances. This paper introduces a typography-based monocular distance estimation framework, which exploits the standardized typography of license plates as passive fiducial markers for metric distance estimation. The core geometric module uses robust plate detection and character segmentation to measure character height and computes distance via the pinhole camera model. The system incorporates interactive calibration, adaptive detection with strict and permissive modes, and multi-method character segmentation leveraging both adaptive and global thresholding. To enhance robustness, the framework further includes camera pose compensation using lane-based horizon estimation, hybrid deep-learning fusion, temporal Kalman filtering for velocity estimation, and multi-feature fusion that exploits additional typographic cues such as stroke width, character spacing, and plate border thickness. Experimental validation with a calibrated monocular camera in a controlled indoor setup achieved a coefficient of variation of 2.3% in character height across consecutive frames and a mean absolute error of 7.7%. The framework operates without GPU acceleration, demonstrating real-time feasibility. A comprehensive comparison with a plate-width based method shows that character-based ranging reduces the standard deviation of estimates by 35%, translating to smoother, more consistent distance readings in practice, where erratic estimates could trigger unnecessary braking or acceleration.
- Abstract(参考訳): 正確な車間距離推定は、先進運転支援システムと自律運転の基盤となる。
LiDARとレーダーは精度が高いが、そのコストは大衆車への普及を妨げている。
単眼視は低コストの代替手段を提供するが、規模のあいまいさと環境障害に対する感受性に悩まされている。
本稿では,基準プレートの標準化型タイポグラフィを,メートル法距離推定のためのパッシブ・フィデューシャルマーカーとして活用する,タイポグラフィに基づく単眼距離推定フレームワークを提案する。
コア幾何学モジュールは、ロバストプレート検出と文字セグメンテーションを使用して文字の高さを測定し、ピンホールカメラモデルを介して距離を計算する。
このシステムは、インタラクティブキャリブレーション、厳密でパーミッシブなモードによる適応検出、および適応しきい値とグローバルしきい値の両方を活用するマルチメソッド文字セグメンテーションを備えている。
強靭性を高めるために、このフレームワークはさらに、レーンベースの地平線推定、ハイブリッドディープラーニング融合、速度推定のための時間的カルマンフィルタリング、ストローク幅、キャラクタ間隔、プレート境界厚さなどの追加のタイポグラフィー手がかりを利用する多機能融合を用いたカメラポーズ補償を含む。
室内で調整された単眼カメラを用いた実験では、連続するフレーム間の文字の高さが2.3%、平均絶対誤差が7.7%であった。
このフレームワークはGPUアクセラレーションなしで動作し、リアルタイムの実現可能性を示す。
プレート幅に基づく手法と総合的に比較すると、不規則な推定が不要なブレーキや加速度を引き起こす場合、文字ベースの測度の標準偏差を35%減らし、スムーズで一貫した距離の読み取りに変換する。
関連論文リスト
- A2VISR: An Active and Adaptive Ground-Aerial Localization System Using Visual Inertial and Single-Range Fusion [17.59898575353575]
これは、地上と航空の協調システムを用いて、散在した環境下での飛行ロボットのロケライズロバスト性を高めるための実践的なアプローチである。
我々は、アクティブビジョン、単一配列、慣性計測、光学フローを統合した地上局地化フレームワークをより包括的に改善する。
提案手法は、平均根平均平方誤差が約0.09mであり、損失とセンサ故障を捕捉するためのレジリエンスを維持しながら、ロバストなオンラインローカライゼーションを実現する。
論文 参考訳(メタデータ) (2025-12-18T10:07:06Z) - Gamma-from-Mono: Road-Relative, Metric, Self-Supervised Monocular Geometry for Vehicular Applications [2.9457242478147503]
本稿では,軽量な単分子幾何推定法であるGamma-from-Mono (GfM)を紹介する。
GfMはガンマで表される残差とともに支配的な道路面を予測する。
地上のカメラの高さだけで、GfMは決定論的に閉じた形を通してメートル法的な深さを回復する。
論文 参考訳(メタデータ) (2025-12-03T22:37:38Z) - Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z) - Holistic Grid Fusion Based Stop Line Estimation [5.5476621209686225]
交差点で前もって停止する場所を知ることは、車両の長手速度を制御する上で必須のパラメータである。
文献における既存の手法のほとんどは、カメラのみを使用して停止線を検出するが、通常は検出範囲の点で不十分である。
本稿では,ステレオカメラやライダーなどの融合多感データを入力として活用し,ニューラルネットワークアーキテクチャを慎重に設計し,停止線を検出する手法を提案する。
論文 参考訳(メタデータ) (2020-09-18T21:29:06Z) - Accurate Alignment Inspection System for Low-resolution Automotive and
Mobility LiDAR [125.41260574344933]
車両やロボットなどの移動システムにおいて,センサ装着後のLiDARアライメント誤差を正確に推定する検査システムを提案する。
提案手法は, 固定位置における1つのターゲットボードのみを用いて, 水平方向(回転, 傾き, ヨー)とLiDARアタッチメントの水平位置を, 水平方向の精度で推定する。
論文 参考訳(メタデータ) (2020-08-24T17:47:59Z) - Deep Soft Procrustes for Markerless Volumetric Sensor Alignment [81.13055566952221]
本研究では、より堅牢なマルチセンサ空間アライメントを実現するために、マーカーレスデータ駆動対応推定を改善する。
我々は、幾何学的制約を終末的に典型的なセグメンテーションベースモデルに組み込み、対象のポーズ推定タスクと中間密な分類タスクをブリッジする。
実験により,マーカーベースの手法で同様の結果が得られ,マーカーレス手法よりも優れ,またキャリブレーション構造のポーズ変動にも頑健であることがわかった。
論文 参考訳(メタデータ) (2020-03-23T10:51:32Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。