論文の概要: Object-Centric Stereo Ranging for Autonomous Driving: From Dense Disparity to Census-Based Template Matching
- arxiv url: http://arxiv.org/abs/2604.07980v1
- Date: Thu, 09 Apr 2026 08:51:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.809186
- Title: Object-Centric Stereo Ranging for Autonomous Driving: From Dense Disparity to Census-Based Template Matching
- Title(参考訳): 自律走行のための物体中心ステレオランキング:Dense Disparity から Census-based Template Matching へ
- Authors: Qihao Huang,
- Abstract要約: 従来の高密度ステレオマッチング法はピクセルごとの不均一マップを生成するが、高い計算コスト、ステレオカメラ間のラジオメトリック差への感度、不均一値が小さい長距離での精度の低下に悩まされている。
本稿では,3つの相補的な深度推定手法を統合した総合ステレオ測位システムを提案する。
- 参考スコア(独自算出の注目度): 1.2691047660244335
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate depth estimation is critical for autonomous driving perception systems, particularly for long range vehicle detection on highways. Traditional dense stereo matching methods such as Block Matching (BM) and Semi Global Matching (SGM) produce per pixel disparity maps but suffer from high computational cost, sensitivity to radiometric differences between stereo cameras, and poor accuracy at long range where disparity values are small. In this report, we present a comprehensive stereo ranging system that integrates three complementary depth estimation approaches: dense BM/SGM disparity, object centric Census based template matching, and monocular geometric priors, within a unified detection ranging tracking pipeline. Our key contribution is a novel object centric Census based template matching algorithm that performs GPU accelerated sparse stereo matching directly within detected bounding boxes, employing a far close divide and conquer strategy, forward backward verification, occlusion aware sampling, and robust multi block aggregation. We further describe an online calibration refinement framework that combines auto rectification offset search, radar stereo voting based disparity correction, and object level radar stereo association for continuous extrinsic drift compensation. The complete system achieves real time performance through asynchronous GPU pipeline design and delivers robust ranging across diverse driving conditions including nighttime, rain, and varying illumination.
- Abstract(参考訳): 正確な深度推定は自律走行認識システム、特に高速道路における長距離車両検出において重要である。
ブロックマッチング (BM) やセミ・グローバルマッチング (SGM) のような従来の密集したステレオマッチング手法は、ピクセルごとの不均等マップを生成するが、高い計算コスト、ステレオカメラ間のラジオメトリック差への感度、不均等値が小さい長距離での精度の低下に悩まされている。
本稿では,高密度BM/SGM不均一性,オブジェクト中心のCensusベースのテンプレートマッチング,および単色幾何学的先行性という3つの相補的深度推定手法を統合した総合的ステレオレンジリングシステムを提案する。
我々の重要な貢献は、検出されたバウンディングボックス内で直接GPUアクセラレーションされたスパースステレオマッチングを実行する、新しいオブジェクト中心のCensusベースのテンプレートマッチングアルゴリズムである。
さらに,自動修正オフセット探索,レーダステレオ投票に基づく不一致補正,オブジェクトレベルレーダステレオアソシエーションを組み合わしたオンライン校正補正フレームワークについて述べる。
完全なシステムは、非同期GPUパイプライン設計を通じてリアルタイムのパフォーマンスを達成し、夜間、雨、様々な照明など、さまざまな運転条件にまたがる堅牢性を提供する。
関連論文リスト
- Typography-Based Monocular Distance Estimation Framework for Vehicle Safety Systems [4.601043621601829]
本稿では,タイポグラフィに基づく単分子距離推定フレームワークを提案する。
これは、メートル法距離推定のためのパッシブ・フィデューシャル・マーカーとして、ナンバープレートの標準化されたタイポグラフィを利用する。
プレート幅法を総合的に比較すると,文字ベースの測度は推定値の標準偏差を35%減少させる。
論文 参考訳(メタデータ) (2026-03-24T04:18:19Z) - Stereo-Inertial Poser: Towards Metric-Accurate Shape-Aware Motion Capture Using Sparse IMUs and a Single Stereo Camera [54.967647497048205]
本稿では,距離精度と形状を考慮した3次元動作を推定するリアルタイムモーションキャプチャシステムであるStereo-Inertial Poserを提案する。
モノクラーRGBをステレオビジョンに置き換え、直接3次元キーポイント抽出と形状パラメータ推定を可能にした。
ドリフトフリーなグローバル翻訳を長い記録時間で生成し,フットスケート効果を低減させる。
論文 参考訳(メタデータ) (2026-03-02T17:46:38Z) - Integrating Disparity Confidence Estimation into Relative Depth Prior-Guided Unsupervised Stereo Matching [55.784713740698365]
教師なしのステレオマッチングは、コストのかかる不均一なアノテーションから独立して、大きな注目を集めている。
実現可能な解決策は、相対深度マップからステレオマッチングネットワークへの3次元幾何学的知識の転送にある。
本研究は,これらの課題に対処する新しい教師なし学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-02T09:11:05Z) - Lane-Wise Highway Anomaly Detection [8.086502588472783]
本稿では,車線道路交通異常検出のためのスケーラブルかつ解釈可能なフレームワークを提案する。
従来のセンサ依存の手法とは異なり、我々の手法はAIを利用した視覚モデルを用いて車線固有の特徴を抽出する。
我々のフレームワークは、精度、リコール、F1スコアにおいて最先端の手法より優れています。
論文 参考訳(メタデータ) (2025-05-05T12:32:23Z) - Stereo-LiDAR Fusion by Semi-Global Matching With Discrete Disparity-Matching Cost and Semidensification [0.358439716487063]
ステレオカメラ入力で光検出・ランキング(LiDAR)データを融合するリアルタイム非学習深度推定法を提案する。
KITTIデータセットで評価すると,提案手法は2.79%の誤差率を達成した。
本手法のリアルタイム・非学習性は,ロボット工学や自動化の応用に極めて有用であると考えている。
論文 参考訳(メタデータ) (2025-04-07T14:54:08Z) - CFTrack: Center-based Radar and Camera Fusion for 3D Multi-Object
Tracking [9.62721286522053]
本稿では,レーダとカメラセンサの融合に基づく共同物体検出と追跡のためのエンドツーエンドネットワークを提案する。
提案手法では,物体検出に中心型レーダカメラ融合アルゴリズムを用い,物体関連にグリーディアルゴリズムを用いる。
提案手法は,20.0AMOTAを達成し,ベンチマークにおける視覚ベースの3Dトラッキング手法よりも優れる,挑戦的なnuScenesデータセット上で評価する。
論文 参考訳(メタデータ) (2021-07-11T23:56:53Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Towards Autonomous Driving: a Multi-Modal 360$^{\circ}$ Perception
Proposal [87.11988786121447]
本稿では,自動運転車の3次元物体検出と追跡のためのフレームワークを提案する。
このソリューションは、新しいセンサ融合構成に基づいて、正確で信頼性の高い道路環境検出を提供する。
自動運転車に搭載されたシステムの様々なテストは、提案された知覚スタックの適合性を評価することに成功している。
論文 参考訳(メタデータ) (2020-08-21T20:36:21Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。