論文の概要: Stereo-LiDAR Depth Estimation with Deformable Propagation and Learned Disparity-Depth Conversion
- arxiv url: http://arxiv.org/abs/2404.07545v1
- Date: Thu, 11 Apr 2024 08:12:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 14:39:15.986961
- Title: Stereo-LiDAR Depth Estimation with Deformable Propagation and Learned Disparity-Depth Conversion
- Title(参考訳): 変形可能な伝播と学習した距離-深さ変換によるステレオLiDAR深さ推定
- Authors: Ang Li, Anning Hu, Wei Xi, Wenxian Yu, Danping Zou,
- Abstract要約: SDG-Depth という名前のセミデンスヒント誘導を用いた新しいステレオLiDAR深度推定ネットワークを提案する。
我々のネットワークは、学習可能な変形可能なウィンドウを用いてスパースヒントを伝播することにより、半密度のヒントマップと信頼マップを生成する変形可能な伝搬モジュールを含む。
本手法は正確かつ効率的であり, ベンチマーク実験の結果, 優れた性能を示した。
- 参考スコア(独自算出の注目度): 16.164300644900404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate and dense depth estimation with stereo cameras and LiDAR is an important task for automatic driving and robotic perception. While sparse hints from LiDAR points have improved cost aggregation in stereo matching, their effectiveness is limited by the low density and non-uniform distribution. To address this issue, we propose a novel stereo-LiDAR depth estimation network with Semi-Dense hint Guidance, named SDG-Depth. Our network includes a deformable propagation module for generating a semi-dense hint map and a confidence map by propagating sparse hints using a learned deformable window. These maps then guide cost aggregation in stereo matching. To reduce the triangulation error in depth recovery from disparity, especially in distant regions, we introduce a disparity-depth conversion module. Our method is both accurate and efficient. The experimental results on benchmark tests show its superior performance. Our code is available at https://github.com/SJTU-ViSYS/SDG-Depth.
- Abstract(参考訳): ステレオカメラとLiDARによる正確な深度推定は、自動走行とロボット知覚にとって重要な課題である。
LiDAR点からのスパースヒントはステレオマッチングにおけるコストアグリゲーションを改善するが、その効果は低密度および非均一分布によって制限される。
この問題に対処するために,SDG-Depth という名前のセミセンスヒントガイダンスを用いた新しいステレオLiDAR深度推定ネットワークを提案する。
我々のネットワークは、学習可能な変形可能なウィンドウを用いてスパースヒントを伝播することにより、半密度のヒントマップと信頼マップを生成する変形可能な伝搬モジュールを含む。
これらの写像はステレオマッチングにおけるコストアグリゲーションを導く。
特に遠隔地における深度復元における三角誤差を低減するため,深度変換モジュールを導入する。
私たちの方法は正確かつ効率的です。
ベンチマーク実験の結果, 優れた性能を示した。
私たちのコードはhttps://github.com/SJTU-ViSYS/SDG-Depth.comで公開されています。
関連論文リスト
- OCTraN: 3D Occupancy Convolutional Transformer Network in Unstructured
Traffic Scenarios [0.0]
我々は2次元画像特徴を3次元占有特徴に変換するために反復アテンションを用いたトランスフォーマーアーキテクチャOCTraNを提案する。
また、LiDARの地上真実の必要性を排除し、任意のシーンにモデルを一般化するための自己教師型トレーニングパイプラインも開発している。
論文 参考訳(メタデータ) (2023-07-20T15:06:44Z) - Robust and accurate depth estimation by fusing LiDAR and Stereo [8.85338187686374]
本稿では,LiDARとステレオカメラを融合させる高精度でロバストな手法を提案する。
この方法は、LiDARとステレオカメラの利点を完全に組み合わせている。
提案したパイプラインをKITTIベンチマークで評価した。
論文 参考訳(メタデータ) (2022-07-13T11:55:15Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Volumetric Propagation Network: Stereo-LiDAR Fusion for Long-Range Depth
Estimation [81.08111209632501]
長距離深度推定のための幾何認識型ステレオLiDAR融合ネットワークを提案する。
ステレオ画像の対応を統一した3Dボリューム空間で導くためのキューとして、スパースで正確な点群を活用します。
我々のネットワークは,KITTIおよびVirtual-KITTIデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-03-24T03:24:46Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - Direct Depth Learning Network for Stereo Matching [79.3665881702387]
ステレオマッチングのための新しいダイレクトディープス学習ネットワーク(DDL-Net)が設計されている。
DDL-Netは、粗度推定段階と適応勾配深度補正段階の2段階からなる。
我々は,DDL-NetがSceneFlowデータセットで25%,DrivingStereoデータセットで12%の平均的な改善を実現していることを示す。
論文 参考訳(メタデータ) (2020-12-10T10:33:57Z) - Wasserstein Distances for Stereo Disparity Estimation [62.09272563885437]
既定義の離散値の集合上の分布を出力する、奥行き推定や不均一推定への既存のアプローチ。
これにより、真の深さや差がこれらの値と一致しない場合に、不正確な結果をもたらす。
任意の深さの値を出力できる新しいニューラルネットワークアーキテクチャを用いて、これらの問題に対処する。
論文 参考訳(メタデータ) (2020-07-06T21:37:50Z) - Decoder Modulation for Indoor Depth Completion [2.099922236065961]
深さの完了は、センサ測定から密度の深い深度マップを復元する。
現在の手法は主に、屋外環境でのLiDARからの非常にスパースな深度測定のために調整されている。
本稿では,これらの地域間の統計的差異を考慮した新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-05-18T11:42:42Z) - DELTAS: Depth Estimation by Learning Triangulation And densification of
Sparse points [14.254472131009653]
多視点ステレオ (MVS) は, 能動深度センシングの精度と単眼深度推定の実用性の間の黄金平均値である。
3次元畳み込みニューラルネットワーク(CNN)を用いたコストボリュームベースのアプローチにより、MVSシステムの精度が大幅に向上した。
まず、(a)興味点の記述子を検出して評価し、次に(b)興味点の小さな集合をマッチングして三角測量し、最後に(c)CNNを用いてこのスパースな3D点の集合を密度化することで、効率的な深さ推定手法を提案する。
論文 参考訳(メタデータ) (2020-03-19T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。