論文の概要: Exploring the Impacts from Datasets to Monocular Depth Estimation (MDE)
Models with MineNavi
- arxiv url: http://arxiv.org/abs/2008.08454v2
- Date: Tue, 28 Jun 2022 13:55:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 12:25:17.103027
- Title: Exploring the Impacts from Datasets to Monocular Depth Estimation (MDE)
Models with MineNavi
- Title(参考訳): MineNaviによるデータセットから単眼深度推定(MDE)モデルへのインパクトの探索
- Authors: Xiangtong Wang, Binbin Liang, Menglong Yang and Wei Li
- Abstract要約: ディープラーニングに基づく現在のコンピュータビジョンタスクは、モデルトレーニングやテストのためのアノテーションを備えた大量のデータを必要とする。
実際には、高密度推定タスクのための手動ラベリングは非常に困難または不可能であり、データセットのシーンは小さな範囲に制限されることが多い。
本稿では,手作業の負担を伴わない拡張可能なデータセットを得るための合成データセット生成手法を提案する。
- 参考スコア(独自算出の注目度): 5.689127984415125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current computer vision tasks based on deep learning require a huge amount of
data with annotations for model training or testing, especially in some dense
estimation tasks, such as optical flow segmentation and depth estimation. In
practice, manual labeling for dense estimation tasks is very difficult or even
impossible, and the scenes of the dataset are often restricted to a small
range, which dramatically limits the development of the community. To overcome
this deficiency, we propose a synthetic dataset generation method to obtain the
expandable dataset without burdensome manual workforce. By this method, we
construct a dataset called MineNavi containing video footages from
first-perspective-view of the aircraft matched with accurate ground truth for
depth estimation in aircraft navigation application. We also provide
quantitative experiments to prove that pre-training via our MineNavi dataset
can improve the performance of depth estimation model and speed up the
convergence of the model on real scene data. Since the synthetic dataset has a
similar effect to the real-world dataset in the training process of deep model,
we also provide additional experiments with monocular depth estimation method
to demonstrate the impact of various factors in our dataset such as lighting
conditions and motion mode.
- Abstract(参考訳): ディープラーニングに基づく現在のコンピュータビジョンタスクは、特に光学フローのセグメンテーションや深度推定のような高密度な推定タスクにおいて、モデルトレーニングやテストのためのアノテーションを備えた大量のデータを必要とする。
実際には、密な見積もりタスクのための手動ラベリングは非常に困難または不可能であり、データセットのシーンは、しばしば小さな範囲に制限され、コミュニティの発展を劇的に制限する。
この欠点を克服するために,手作業を負担することなく拡張可能なデータセットを得るための合成データセット生成手法を提案する。
本手法により,航空機ナビゲーションにおける深度推定のための正確な地上真実と一致した航空機の1周視映像を含むMineNaviというデータセットを構築した。
また,ミネナビデータセットによる事前トレーニングにより,深度推定モデルの性能が向上し,実シーンデータに対するモデルの収束が高速化できることを示す定量的実験を行った。
合成データセットは,深部モデルの訓練過程における実世界のデータセットと類似した効果を持つため,光条件や運動モードなどのデータセットにおける様々な要因の影響を示すために,単眼深度推定法を用いて追加実験を行う。
関連論文リスト
- A New Dataset for Monocular Depth Estimation Under Viewpoint Shifts [6.260553883409459]
本稿では,異なるカメラ位置と方向が単眼深度推定性能に与える影響を定量化するための新しいデータセットと評価手法を提案する。
ホログラフィー推定と物体検出に基づく地中真理戦略を提案し,高価なライダーセンサの必要性を排除した。
論文 参考訳(メタデータ) (2024-09-26T13:57:05Z) - TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定値から計量深度値を求めるための,実践的なオンラインスケール回復手法であるTanDepthを提案する。
本手法は無人航空機(UAV)の用途に応用され,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスシミュレーションフィルタへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - Domain-Transferred Synthetic Data Generation for Improving Monocular Depth Estimation [9.812476193015488]
本稿では,3次元合成環境とCycleGANドメイン転送を用いたシミュレーションデータ生成手法を提案する。
本研究では,DenseDepth構造に基づく深度推定モデルを実データと模擬データの異なるトレーニングセットを用いて学習することにより,このデータ生成手法を,人気のNYUDepth V2データセットと比較する。
本稿では,Huskyロボットによる新たに収集した画像とLiDAR深度データを用いたモデルの性能評価を行い,GAN変換データを実世界のデータ,特に深度推定の有効な代替手段として有効であることを示す。
論文 参考訳(メタデータ) (2024-05-02T09:21:10Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Dataset Distillation: A Comprehensive Review [76.26276286545284]
データセット蒸留(DD)は、トレーニングされたモデルが元のデータセットでトレーニングされたデータセットに匹敵するパフォーマンスを得るために、合成サンプルを含むはるかに小さなデータセットを導出することを目的としている。
本稿ではDDの最近の進歩とその応用について概説する。
論文 参考訳(メタデータ) (2023-01-17T17:03:28Z) - SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for
Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。
トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。
単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。
我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文 参考訳(メタデータ) (2022-11-07T16:17:47Z) - Learning to Simulate Realistic LiDARs [66.7519667383175]
リアルLiDARセンサのデータ駆動シミュレーションのためのパイプラインを提案する。
本モデルでは, 透明表面上の落下点などの現実的な効果を符号化できることが示される。
我々は2つの異なるLiDARセンサのモデルを学習し、それに従ってシミュレーションされたLiDARデータを改善する。
論文 参考訳(メタデータ) (2022-09-22T13:12:54Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Joint Prediction of Monocular Depth and Structure using Planar and
Parallax Geometry [4.620624344434533]
教師付き学習深度推定法は、LiDARデータのような高品質な地上構造で訓練すると、優れた性能が得られる。
提案手法は,有望な平面とパララックス幾何学パイプラインの構造情報と深度情報を組み合わせたU-Net教師あり学習ネットワークの構築である。
我々のモデルは細い物体と縁の深さ予測に優れており、構造予測ベースラインと比較して、より頑健に機能する。
論文 参考訳(メタデータ) (2022-07-13T17:04:05Z) - DeepSatData: Building large scale datasets of satellite images for
training machine learning models [77.17638664503215]
本稿では,機械学習モデルの学習のための衛星画像データセットの自動生成のための設計検討を行う。
本稿では,ニューラルネットワークの深層学習と評価の観点から直面する課題について論じる。
論文 参考訳(メタデータ) (2021-04-28T15:13:12Z) - Domain Adaptive Monocular Depth Estimation With Semantic Information [13.387521845596149]
ドメインギャップを狭めるためにセマンティック情報を活用した対比トレーニングモデルを提案する。
提案したコンパクトモデルは,複雑な最新モデルに匹敵する最先端性能を実現する。
論文 参考訳(メタデータ) (2021-04-12T18:50:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。