論文の概要: Self-Supervised Learning for Monocular Depth Estimation from Aerial
Imagery
- arxiv url: http://arxiv.org/abs/2008.07246v1
- Date: Mon, 17 Aug 2020 12:20:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 04:00:33.034715
- Title: Self-Supervised Learning for Monocular Depth Estimation from Aerial
Imagery
- Title(参考訳): 航空画像からの単眼深度推定のための自己教師あり学習
- Authors: Max Hermann, Boitumelo Ruf, Martin Weinmann, Stefan Hinz
- Abstract要約: 航空画像からの単眼深度推定のための自己教師型学習法を提案する。
このために、単一の移動カメラからの画像シーケンスのみを使用し、深度を同時に推定し、情報をポーズすることを学ぶ。
ポーズと深さ推定の重みを共有することによって、比較的小さなモデルが実現され、リアルタイムの応用が好まれる。
- 参考スコア(独自算出の注目度): 0.20072624123275526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Supervised learning based methods for monocular depth estimation usually
require large amounts of extensively annotated training data. In the case of
aerial imagery, this ground truth is particularly difficult to acquire.
Therefore, in this paper, we present a method for self-supervised learning for
monocular depth estimation from aerial imagery that does not require annotated
training data. For this, we only use an image sequence from a single moving
camera and learn to simultaneously estimate depth and pose information. By
sharing the weights between pose and depth estimation, we achieve a relatively
small model, which favors real-time application. We evaluate our approach on
three diverse datasets and compare the results to conventional methods that
estimate depth maps based on multi-view geometry. We achieve an accuracy
{\delta}1.25 of up to 93.5 %. In addition, we have paid particular attention to
the generalization of a trained model to unknown data and the self-improving
capabilities of our approach. We conclude that, even though the results of
monocular depth estimation are inferior to those achieved by conventional
methods, they are well suited to provide a good initialization for methods that
rely on image matching or to provide estimates in regions where image matching
fails, e.g. occluded or texture-less regions.
- Abstract(参考訳): 単眼深度推定のための教師付き学習法は通常、大量の注釈付きトレーニングデータを必要とする。
航空画像の場合、この地上の真理は特に取得が困難である。
そこで本稿では,注釈付きトレーニングデータを必要としない空中画像から単眼深度推定のための自己教師型学習法を提案する。
このために,単一の移動カメラからの画像シーケンスのみを使用し,深度とポーズ情報を同時に推定することを学ぶ。
ポーズと深さ推定の重みを共有することで,リアルタイムアプリケーションを好む比較的小さなモデルを実現する。
提案手法を3つの多様なデータセット上で評価し,マルチビュー幾何に基づいて深度マップを推定する従来の手法と比較した。
我々は 93.5 % までの精度 {\delta}1.25 を達成する。
さらに、未知のデータに対する訓練されたモデルの一般化と、我々のアプローチの自己改善能力に特に注意を払っている。
本研究は, 単眼深度推定の結果が従来の手法よりも劣っているものの, 画像マッチングに依存する手法や, オーククラッド領域やテクスチャレス領域など, 画像マッチングが失敗する領域において, 適切な初期化を行うのに適していると結論づける。
関連論文リスト
- ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation [62.600382533322325]
本研究では,新しい単分子深度推定法であるScaleDepthを提案する。
提案手法は,距離深度をシーンスケールと相対深度に分解し,セマンティック・アウェア・スケール予測モジュールを用いて予測する。
本手法は,室内と屋外の両方のシーンを統一した枠組みで距離推定する。
論文 参考訳(メタデータ) (2024-07-11T05:11:56Z) - SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for
Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。
トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。
単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。
我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文 参考訳(メタデータ) (2022-11-07T16:17:47Z) - Towards Accurate Reconstruction of 3D Scene Shape from A Single
Monocular Image [91.71077190961688]
まず、未知のスケールまで深さを予測し、単一の単眼画像からシフトする2段階のフレームワークを提案する。
次に、3Dポイントの雲のデータを利用して、奥行きの変化とカメラの焦点距離を予測し、3Dシーンの形状を復元します。
我々は9つの未知のデータセットで深度モデルを検証し、ゼロショット評価で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-28T16:20:14Z) - 360 Depth Estimation in the Wild -- The Depth360 Dataset and the SegFuse
Network [35.03201732370496]
全方位画像からの一視点深度推定は、自律運転やシーン再構築といった幅広い応用で人気を博している。
本研究ではまず,トレーニングデータ問題に対処するため,Depth360と呼ばれるさまざまな設定の大規模データセットを構築した。
次に、人間の眼を模倣してデータセットから効果的に学習する、エンドツーエンドのマルチタスク学習ネットワークであるSegFuseを提案する。
論文 参考訳(メタデータ) (2022-02-16T11:56:31Z) - Improving Depth Estimation using Location Information [0.0]
本稿では,自己教師型深度学習法の改良を行い,高精度な単眼深度推定を行う。
主なアイデアは、異なるフレームのシーケンスを考慮に入れたディープモデルをトレーニングすることであり、各フレームはその位置情報でタグ付けされる。
論文 参考訳(メタデータ) (2021-12-27T22:30:14Z) - On the Sins of Image Synthesis Loss for Self-supervised Depth Estimation [60.780823530087446]
画像合成の改善は深度推定の改善を必要としないことを示す。
この発散現象は、データから生じるアレラトリックな不確実性に起因している。
この観察された発散は、以前に報告されたり、深く研究されたりしていない。
論文 参考訳(メタデータ) (2021-09-13T17:57:24Z) - Variational Monocular Depth Estimation for Reliability Prediction [12.951621755732544]
教師付き学習手法の代替として,単眼深度推定のための自己教師付き学習が広く研究されている。
従来はモデル構造の変更による深度推定の精度向上に成功している。
本稿では, 単眼深度推定のための変分モデルを理論的に定式化し, 推定深度画像の信頼性を推定する。
論文 参考訳(メタデータ) (2020-11-24T06:23:51Z) - Learning a Geometric Representation for Data-Efficient Depth Estimation
via Gradient Field and Contrastive Loss [29.798579906253696]
本研究では、コンブネットがラベルのない画像で幾何学的情報を抽出するのを支援するために、運動量差の少ない勾配に基づく自己教師付き学習アルゴリズムを提案する。
提案手法は,従来の自己教師付き学習アルゴリズムよりも優れ,ラベル付きデータの効率を3倍に向上させる。
論文 参考訳(メタデータ) (2020-11-06T06:47:19Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z) - Don't Forget The Past: Recurrent Depth Estimation from Monocular Video [92.84498980104424]
私たちは3つの異なる種類の深さ推定を共通のフレームワークに組み込んだ。
提案手法は, 時系列の深度マップを生成する。
モノクロビデオにのみ適用したり、異なる種類のスパース深度パターンと組み合わせたりすることができる。
論文 参考訳(メタデータ) (2020-01-08T16:50:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。