論文の概要: A Systematic Literature Review on Deep Learning-based Depth Estimation in Computer Vision
- arxiv url: http://arxiv.org/abs/2501.05147v1
- Date: Thu, 09 Jan 2025 10:56:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-10 13:59:55.656785
- Title: A Systematic Literature Review on Deep Learning-based Depth Estimation in Computer Vision
- Title(参考訳): コンピュータビジョンにおける深層学習に基づく深度推定に関する体系的文献レビュー
- Authors: Ali Rohan, Md Junayed Hasan, Andrei Petrovski,
- Abstract要約: 深度推定(DE)は、シーンに関する空間情報を提供し、3次元再構成、オブジェクト検出、シーン理解などのタスクを可能にする。
DEのためのDLモデルは、入力データから関連する特徴を自動的に抽出し、様々なシーン条件に適応し、目に見えない環境によく一般化することができる。
DEに関する以前のレビューは、Deを包括的にレビューするのではなく、主に単分子またはステレオベースのテクニックに焦点を当ててきた。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Depth estimation (DE) provides spatial information about a scene and enables tasks such as 3D reconstruction, object detection, and scene understanding. Recently, there has been an increasing interest in using deep learning (DL)-based methods for DE. Traditional techniques rely on handcrafted features that often struggle to generalise to diverse scenes and require extensive manual tuning. However, DL models for DE can automatically extract relevant features from input data, adapt to various scene conditions, and generalise well to unseen environments. Numerous DL-based methods have been developed, making it necessary to survey and synthesize the state-of-the-art (SOTA). Previous reviews on DE have mainly focused on either monocular or stereo-based techniques, rather than comprehensively reviewing DE. Furthermore, to the best of our knowledge, there is no systematic literature review (SLR) that comprehensively focuses on DE. Therefore, this SLR study is being conducted. Initially, electronic databases were searched for relevant publications, resulting in 1284 publications. Using defined exclusion and quality criteria, 128 publications were shortlisted and further filtered to select 59 high-quality primary studies. These studies were analysed to extract data and answer defined research questions. Based on the results, DL methods were developed for mainly three different types of DE: monocular, stereo, and multi-view. 20 publicly available datasets were used to train, test, and evaluate DL models for DE, with KITTI, NYU Depth V2, and Make 3D being the most used datasets. 29 evaluation metrics were used to assess the performance of DE. 35 base models were reported in the primary studies, and the top five most-used base models were ResNet-50, ResNet-18, ResNet-101, U-Net, and VGG-16. Finally, the lack of ground truth data was among the most significant challenges reported by primary studies.
- Abstract(参考訳): 深度推定(DE)は、シーンに関する空間情報を提供し、3次元再構成、オブジェクト検出、シーン理解などのタスクを可能にする。
近年,De の深層学習(DL)に基づく手法への関心が高まっている。
伝統的な技法は、様々な場面を一般化するのにしばしば苦労し、広範囲な手動チューニングを必要とする手作りの特徴に依存している。
しかし、DEC用のDLモデルは、入力データから関連する特徴を自動的に抽出し、様々なシーン条件に適応し、目に見えない環境によく一般化することができる。
多くのDLベースの手法が開発され,SOTA(State-of-the-art)の探索と合成が求められている。
DEに関する以前のレビューは、Deを包括的にレビューするのではなく、主に単分子またはステレオベースのテクニックに焦点を当ててきた。
さらに,我々の知識を最大限に活用するために,包括的にDreに焦点を当てた体系的文献レビュー(SLR)は存在しない。
そのため、このSLR研究が進められている。
当初、電子データベースは関連する出版物を探し求め、1284年の出版物となった。
定義された除外基準と品質基準を用いて、128の出版物がショートリスト化され、さらに59の高品質の初等研究を選定した。
これらの研究は、データを抽出し、定義された研究質問に答えるために分析された。
その結果, DL法は主にモノクラー, ステレオ, マルチビューの3種類のDDEに対して開発された。
最も使われているデータセットは、KITTI、NYU Depth V2、Make 3Dである。
29 つの評価指標を用いて,DEC の評価を行った。
35のベースモデルが最初の研究で報告され、最も多く使用されたベースモデルはResNet-50、ResNet-18、ResNet-101、U-Net、VGG-16である。
最後に、基礎的真理データの欠如は、初等研究によって報告された最も重要な課題の1つであった。
関連論文リスト
- TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定値から計量深度値を求めるための,実践的なオンラインスケール回復手法であるTanDepthを提案する。
本手法は無人航空機(UAV)の用途に応用され,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスシミュレーションフィルタへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - Beyond Few-shot Object Detection: A Detailed Survey [25.465534270637523]
研究者たちは、数発の学習とオブジェクト検出の原則を融合させる、数発のオブジェクト検出(FSOD)アプローチを導入した。
これらのアプローチは、広範なラベル付きデータセットへの依存を減らす上で重要な役割を果たす。
本研究の目的は,上記の数ショット設定を包括的に理解し,各FSODタスクの方法論を探索することである。
論文 参考訳(メタデータ) (2024-08-26T13:09:23Z) - Advancing 3D Point Cloud Understanding through Deep Transfer Learning: A Comprehensive Survey [3.929140365559557]
本稿では,ディープラーニング(DTL)とドメイン適応(DA)を用いた最新の3DPC理解手法について概観する。
本稿では,3DPCオブジェクト検出,セマンティックラベリング,セグメンテーション,分類,登録,ダウンサンプリング/アップサンプリング,デノナイズなど,さまざまな応用について述べる。
論文 参考訳(メタデータ) (2024-07-25T08:47:27Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for
Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。
トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。
単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。
我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文 参考訳(メタデータ) (2022-11-07T16:17:47Z) - Deep Depth Completion: A Survey [26.09557446012222]
我々は、読者が研究動向をよりよく把握し、現在の進歩を明確に理解するのに役立つ総合的な文献レビューを提供する。
ネットワークアーキテクチャ,損失関数,ベンチマークデータセット,学習戦略の設計面から,関連する研究について検討する。
室内および屋外のデータセットを含む,広く使用されている2つのベンチマークデータセットに対して,モデル性能の定量的比較を行った。
論文 参考訳(メタデータ) (2022-05-11T08:24:00Z) - A Survey on RGB-D Datasets [69.73803123972297]
本稿では,深度情報を含む画像データセットをレビューし,分類した。
アクセス可能なデータを含む203のデータセットを収集し、それらをシーン/オブジェクト、ボディ、医療の3つのカテゴリに分類しました。
論文 参考訳(メタデータ) (2022-01-15T05:35:19Z) - What is the State of the Art of Computer Vision-Assisted Cytology? A
Systematic Literature Review [47.42354724922676]
現在,細胞診に応用されているコンピュータビジョン技術の現状を明らかにするために,システマティック文献レビューを実施している。
分析された研究で最も使われている方法は深層学習(70論文)であるが、古典的なコンピュータビジョンのみ(101論文)を使用するものは少ない。
結論として,多くの染色に対して高品質なデータセットがまだ存在せず,ほとんどの研究は日常的な臨床診断ルーチンに適用できるほど成熟していない。
論文 参考訳(メタデータ) (2021-05-24T13:50:45Z) - Deep Learning-Based Human Pose Estimation: A Survey [66.01917727294163]
人間のポーズ推定は、過去10年間に注目を集めてきた。
ヒューマン・コンピュータ・インタラクション、モーション・アナリティクス、拡張現実、バーチャル・リアリティーなど幅広い用途で利用されている。
最近のディープラーニングベースのソリューションは、人間のポーズ推定において高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-12-24T18:49:06Z) - RGB-D Salient Object Detection: A Survey [195.83586883670358]
様々な観点からRGB-Dに基づくSODモデルを総合的に調査する。
また、このドメインからSODモデルと人気のあるベンチマークデータセットもレビューします。
今後の研究に向けたRGB-DベースのSODの課題と方向性について論じる。
論文 参考訳(メタデータ) (2020-08-01T10:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。