論文の概要: A Survey on Deep Learning Techniques for Stereo-based Depth Estimation
- arxiv url: http://arxiv.org/abs/2006.02535v1
- Date: Mon, 1 Jun 2020 13:09:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 07:44:02.745804
- Title: A Survey on Deep Learning Techniques for Stereo-based Depth Estimation
- Title(参考訳): ステレオによる深度推定のための深度学習手法の検討
- Authors: Hamid Laga, Laurent Valentin Jospin, Farid Boussaid, Mohammed
Bennamoun
- Abstract要約: RGB画像から深度を推定することは、長年続く不適切な問題である。
ステレオベースの深度推定のためのディープラーニングは、コミュニティから関心を集めている。
この新世代の手法は、性能の大きな飛躍を見せている。
- 参考スコア(独自算出の注目度): 30.330599857204344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating depth from RGB images is a long-standing ill-posed problem, which
has been explored for decades by the computer vision, graphics, and machine
learning communities. Among the existing techniques, stereo matching remains
one of the most widely used in the literature due to its strong connection to
the human binocular system. Traditionally, stereo-based depth estimation has
been addressed through matching hand-crafted features across multiple images.
Despite the extensive amount of research, these traditional techniques still
suffer in the presence of highly textured areas, large uniform regions, and
occlusions. Motivated by their growing success in solving various 2D and 3D
vision problems, deep learning for stereo-based depth estimation has attracted
growing interest from the community, with more than 150 papers published in
this area between 2014 and 2019. This new generation of methods has
demonstrated a significant leap in performance, enabling applications such as
autonomous driving and augmented reality. In this article, we provide a
comprehensive survey of this new and continuously growing field of research,
summarize the most commonly used pipelines, and discuss their benefits and
limitations. In retrospect of what has been achieved so far, we also conjecture
what the future may hold for deep learning-based stereo for depth estimation
research.
- Abstract(参考訳): RGB画像から深度を推定することは長年にわたり不適切な問題であり、コンピュータビジョン、グラフィックス、機械学習コミュニティによって何十年も調査されてきた。
既存の技術の中で、ステレオマッチングは人間の双眼鏡システムとの強いつながりから、文献の中で最も広く使われている1つである。
伝統的に、ステレオベースの深度推定は、複数の画像にまたがる手作りの特徴をマッチングすることで対処されてきた。
膨大な研究にもかかわらず、これらの伝統的な技術は、高度に質感のある領域、大きな均一な領域、および咬合の存在に苦しむ。
様々な2Dおよび3D視覚問題の解決に成功し、ステレオベースの深度推定のためのディープラーニングがコミュニティから関心を集め、2014年から2019年の間に150以上の論文が出版された。
この新世代の手法は、自律運転や拡張現実といった応用を可能にするために、パフォーマンスの大きな飛躍を見せている。
本稿では,この新たなかつ継続的な研究分野の包括的調査を行い,最も一般的に使用されているパイプラインを要約するとともに,そのメリットと限界について論じる。
これまでに達成されたことを振り返って、深度推定研究のための深度学習に基づくステレオの今後について予測する。
関連論文リスト
- Event-based Stereo Depth Estimation: A Survey [12.711235562366898]
ステレオプシスは、生物が私たちの3D世界をナビゲートする深度を知覚する主要な方法であるため、ロボット工学において広くアピールされている。
イベントカメラは、非常に高時間分解能と高ダイナミックレンジで、ピクセルごとの明るさ変化を非同期に検出する、バイオインスパイアされた新しいセンサーである。
高度の時間精度もステレオマッチングの恩恵を受けており、イベントカメラが登場して以来の一般的な研究領域として不透明度(深度)が評価されている。
論文 参考訳(メタデータ) (2024-09-26T09:43:50Z) - Deep Learning-based Depth Estimation Methods from Monocular Image and Videos: A Comprehensive Survey [31.414360704020254]
単一のRGB画像とビデオから深度を推定することは、多くの分野で応用されているため、広く関心を集めている。
過去10年間に500以上のディープラーニングベースの論文が出版されている。
入力と出力のモダリティ、ネットワークアーキテクチャ、学習方法に基づいて、現在の作業を分類するための分類を提供する。
論文 参考訳(メタデータ) (2024-06-28T06:25:21Z) - Outdoor Monocular Depth Estimation: A Research Review [0.8749675983608171]
本稿では, 利用可能なデータセット, 深度推定方法, 研究成果, トレンド, 課題, およびオープンリサーチに必要な機会について概説する。
我々の知る限り、公開調査では、屋外深度推定技術と研究範囲の総合的な収集は行われていない。
論文 参考訳(メタデータ) (2022-05-03T10:10:08Z) - 3D Object Detection from Images for Autonomous Driving: A Survey [68.33502122185813]
画像から3Dオブジェクトを検出することは、自動運転の基本的かつ困難な問題の一つだ。
この問題を2015年から2021年にかけて200以上の研究が行われ、理論、アルゴリズム、応用の幅広い範囲で研究されている。
我々は,この新奇で継続的な研究分野を包括的に調査し,画像に基づく3D検出に最もよく使用されるパイプラインを要約する。
論文 参考訳(メタデータ) (2022-02-07T07:12:24Z) - Deep Long-Tailed Learning: A Survey [163.16874896812885]
ディープ・ロングテール・ラーニング(Deep Long-tailed Learning)は、長いテールのクラス分布に追従する多数の画像から、優れたパフォーマンスのディープモデルをトレーニングすることを目的としている。
長い尾を持つクラス不均衡は、現実的な視覚認識タスクにおいて一般的な問題である。
本稿では,近年の長期学習の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2021-10-09T15:25:22Z) - Threat of Adversarial Attacks on Deep Learning in Computer Vision:
Survey II [86.51135909513047]
ディープラーニングは、予測を操作できる敵攻撃に対して脆弱である。
本稿では,ディープラーニングに対する敵対的攻撃におけるコンピュータビジョンコミュニティの貢献を概観する。
この領域では、非専門家に技術的な用語の定義を提供する。
論文 参考訳(メタデータ) (2021-08-01T08:54:47Z) - Deep Learning for Face Anti-Spoofing: A Survey [74.42603610773931]
対面防止(FAS)は、プレゼンテーションアタック(PA)から顔認識システムを保護する上で重要な役割を担っているため、近年注目を集めている。
論文 参考訳(メタデータ) (2021-06-28T19:12:00Z) - Recent Advances in Monocular 2D and 3D Human Pose Estimation: A Deep
Learning Perspective [69.44384540002358]
この問題に対処するための包括的で包括的な2D-to-3D視点を提供する。
2014年からの主流とマイルストーンのアプローチを統一フレームワークで分類しています。
また,ポーズ表現スタイル,ベンチマーク,評価指標,一般的なアプローチの定量的評価を要約した。
論文 参考訳(メタデータ) (2021-04-23T11:07:07Z) - On the Synergies between Machine Learning and Binocular Stereo for Depth
Estimation from Images: a Survey [45.08733033427528]
ステレオマッチングは、40年近い研究と研究期間を持つコンピュータビジョンにおいて、最も長く続いている問題の1つである。
単眼画像と双眼画像からの学習に基づく深度推定の分野での最近の研究は、これまでに達成された成果を浮き彫りにしている。
論文 参考訳(メタデータ) (2020-04-18T09:14:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。