論文の概要: SelfTune: Metrically Scaled Monocular Depth Estimation through
Self-Supervised Learning
- arxiv url: http://arxiv.org/abs/2203.05332v1
- Date: Thu, 10 Mar 2022 12:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 14:29:57.404851
- Title: SelfTune: Metrically Scaled Monocular Depth Estimation through
Self-Supervised Learning
- Title(参考訳): selftune: 自己教師付き学習による計量的単眼深度推定
- Authors: Jaehoon Choi, Dongki Jung, Yonghan Lee, Deokhwa Kim, Dinesh Manocha,
Donghwan Lee
- Abstract要約: 本稿では,事前学習した教師付き単分子深度ネットワークに対する自己教師付き学習手法を提案する。
本手法は移動ロボットナビゲーションなどの様々な応用に有用であり,多様な環境に適用可能である。
- 参考スコア(独自算出の注目度): 53.78813049373321
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular depth estimation in the wild inherently predicts depth up to an
unknown scale. To resolve scale ambiguity issue, we present a learning
algorithm that leverages monocular simultaneous localization and mapping (SLAM)
with proprioceptive sensors. Such monocular SLAM systems can provide metrically
scaled camera poses. Given these metric poses and monocular sequences, we
propose a self-supervised learning method for the pre-trained supervised
monocular depth networks to enable metrically scaled depth estimation. Our
approach is based on a teacher-student formulation which guides our network to
predict high-quality depths. We demonstrate that our approach is useful for
various applications such as mobile robot navigation and is applicable to
diverse environments. Our full system shows improvements over recent
self-supervised depth estimation and completion methods on EuRoC, OpenLORIS,
and ScanNet datasets.
- Abstract(参考訳): 野生における単分子深度推定は、本質的に未知のスケールまで深度を予測する。
そこで本研究では,単眼同時局在化マッピング(slam)と固有受容センサを用いた学習アルゴリズムを提案する。
このような単眼式スラムシステムは、メートル法的なカメラポーズを提供することができる。
これらの距離ポーズと単眼列を仮定し,事前学習した単眼深度ネットワークに対する自己教師あり学習法を提案する。
提案手法は,ネットワークを誘導して高品質な深度を予測する教師学生の定式化に基づいている。
本手法は移動ロボットナビゲーションなどの様々な応用に有用であり,多様な環境に適用可能であることを示す。
本システムでは,最近のEuRoC,OpenLORIS,ScanNetデータセット上での自己教師付き深度推定および完了手法の改善を示す。
関連論文リスト
- UnCLe: Unsupervised Continual Learning of Depth Completion [5.677777151863184]
UnCLeはマルチモーダル深度推定タスクの教師なし連続学習のための標準ベンチマークである。
連続したデータストリーム上の教師なし学習の実践シナリオ下で、深度補完モデルをベンチマークする。
論文 参考訳(メタデータ) (2024-10-23T17:56:33Z) - Self-Supervised Learning based Depth Estimation from Monocular Images [0.0]
単色深度推定の目標は、入力として2次元単色RGB画像が与えられた深度マップを予測することである。
我々は、トレーニング中に固有のカメラパラメータを実行し、我々のモデルをさらに一般化するために天気増悪を適用することを計画している。
論文 参考訳(メタデータ) (2023-04-14T07:14:08Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - Improving Monocular Visual Odometry Using Learned Depth [84.05081552443693]
単眼深度推定を応用して視力計測(VO)を改善する枠組みを提案する。
我々のフレームワークの中核は、多様なシーンに対して強力な一般化能力を持つ単眼深度推定モジュールである。
現在の学習型VO法と比較して,本手法は多様なシーンに対してより強力な一般化能力を示す。
論文 参考訳(メタデータ) (2022-04-04T06:26:46Z) - Self-Supervised Monocular Depth Estimation with Internal Feature Fusion [12.874712571149725]
深度推定のための自己教師付き学習は、画像列の幾何学を用いて監督する。
そこで本研究では,ダウンおよびアップサンプリングの手順で意味情報を利用することのできる,新しい深度推定ネットワークDIFFNetを提案する。
論文 参考訳(メタデータ) (2021-10-18T17:31:11Z) - Towards Interpretable Deep Networks for Monocular Depth Estimation [78.84690613778739]
我々は,深部MDEネットワークの解釈可能性について,その隠蔽ユニットの深さ選択性を用いて定量化する。
本稿では,解釈可能なMDE深層ネットワークを,元のアーキテクチャを変更することなく学習する手法を提案する。
実験により,本手法は深部MDEネットワークの解釈可能性を向上させることができることが示された。
論文 参考訳(メタデータ) (2021-08-11T16:43:45Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z) - Monocular Depth Estimation Based On Deep Learning: An Overview [16.2543991384566]
単一の画像から深度情報(眼深度推定)を推定することは不適切な問題である。
ディープラーニングは最近広く研究され、精度で有望なパフォーマンスを達成した。
深度推定の精度を向上させるために,様々な種類のネットワークフレームワーク,損失関数,トレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-03-14T12:35:34Z) - Don't Forget The Past: Recurrent Depth Estimation from Monocular Video [92.84498980104424]
私たちは3つの異なる種類の深さ推定を共通のフレームワークに組み込んだ。
提案手法は, 時系列の深度マップを生成する。
モノクロビデオにのみ適用したり、異なる種類のスパース深度パターンと組み合わせたりすることができる。
論文 参考訳(メタデータ) (2020-01-08T16:50:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。