論文の概要: Online Adaptation of Monocular Depth Prediction with Visual SLAM
- arxiv url: http://arxiv.org/abs/2111.04096v1
- Date: Sun, 7 Nov 2021 14:20:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 16:36:51.699082
- Title: Online Adaptation of Monocular Depth Prediction with Visual SLAM
- Title(参考訳): Visual SLAMによる単眼深度予測のオンライン適応
- Authors: Shing Yan Loo, Moein Shakeri, Sai Hong Tang, Syamsiah Mashohor, Hong
Zhang
- Abstract要約: CNNによる正確な深度予測の能力は、実用的な視界SLAMアプリケーションで広く利用されている大きな課題である。
深度予測を微調整する2つの相補的なプロセスからなる新しいオンライン適応フレームワークを提案する。
実験環境におけるベンチマークデータセットと実ロボットの両方の実験結果から,提案手法がSLAM再構成精度を向上させることを示す。
- 参考スコア(独自算出の注目度): 8.478040209440868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability of accurate depth prediction by a CNN is a major challenge for
its wide use in practical visual SLAM applications, such as enhanced camera
tracking and dense mapping. This paper is set out to answer the following
question: Can we tune a depth prediction CNN with the help of a visual SLAM
algorithm even if the CNN is not trained for the current operating environment
in order to benefit the SLAM performance? To this end, we propose a novel
online adaptation framework consisting of two complementary processes: a SLAM
algorithm that is used to generate keyframes to fine-tune the depth prediction
and another algorithm that uses the online adapted depth to improve map
quality. Once the potential noisy map points are removed, we perform global
photometric bundle adjustment (BA) to improve the overall SLAM performance.
Experimental results on both benchmark datasets and a real robot in our own
experimental environments show that our proposed method improves the SLAM
reconstruction accuracy. We demonstrate the use of regularization in the
training loss as an effective means to prevent catastrophic forgetting. In
addition, we compare our online adaptation framework against the
state-of-the-art pre-trained depth prediction CNNs to show that our online
adapted depth prediction CNN outperforms the depth prediction CNNs that have
been trained on a large collection of datasets.
- Abstract(参考訳): CNNによる正確な深度予測の能力は、カメラトラッキングの強化や高密度マッピングなど、実用的な視界SLAMアプリケーションで広く利用されている大きな課題である。
CNNがSLAM性能の恩恵を受けるために現在の動作環境のために訓練されていない場合でも、視覚的SLAMアルゴリズムの助けを借りて深度予測CNNを調整できるか?
そこで本研究では,2つの相補的プロセスからなる新しいオンライン適応フレームワークを提案する。深度予測を微調整するキーフレームを生成するslamアルゴリズムと,地図品質を改善するためにオンライン適応深度を用いるアルゴリズムである。
潜在的なノイズマップポイントを除去すると、全体のSLAM性能を改善するために、グローバルな測光束調整(BA)を行う。
実験環境におけるベンチマークデータセットと実ロボットの両方の実験結果から,提案手法がSLAM再構成精度を向上させることを示す。
また, トレーニング損失の正則化を, 破滅的な忘れ込みを防ぐための効果的な方法として示す。
さらに、我々のオンライン適応フレームワークと最先端の訓練済み深度予測CNNを比較し、オンライン適応深度予測CNNが大量のデータセットでトレーニングされた深度予測CNNよりも優れていることを示す。
関連論文リスト
- UncLe-SLAM: Uncertainty Learning for Dense Neural SLAM [60.575435353047304]
我々は、高密度ニューラルネットワークの同時局所化とマッピング(SLAM)のための不確実性学習フレームワークを提案する。
本稿では,2次元入力データのみから自己教師付きで学習可能なセンサ不確実性推定のためのオンラインフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T16:26:25Z) - CNN-Augmented Visual-Inertial SLAM with Planar Constraints [26.024485121674328]
本稿では,畳み込みニューラルネットワーク(CNN)と平面制約を組み合わせた,堅牢なビジュアル慣性SLAMシステムを提案する。
我々はCNNを用いて各画像の深度マップとそれに対応する不確実性マップを予測する。
また,1点RANSACと2点RANSACで水平面を検出する高速平面検出手法を提案する。
論文 参考訳(メタデータ) (2022-05-05T21:49:57Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - Application of 2-D Convolutional Neural Networks for Damage Detection in
Steel Frame Structures [0.0]
本稿では,2次元畳み込みニューラルネットワーク(2次元CNN)を特徴抽出と分類段階の両方に応用する。
本手法では、深度ではなく、光ったCNNのネットワークを使用し、生の加速度信号を入力とする。
論文 参考訳(メタデータ) (2021-10-29T16:29:31Z) - A Front-End for Dense Monocular SLAM using a Learned Outlier Mask Prior [11.468537169201083]
単一のRGB画像からの深度予測の最近の成果は、畳み込みニューラルネットワーク(CNN)と古典的同時ローカライゼーションとマッピング(SLAM)アルゴリズムを組み合わせた新しい研究領域に力を入れている。
現在のCNN-SLAMアプローチのほとんどは、深さ予測のみを生かしているが、CNNの製品はまだない。
我々は,sparseで実装可能な高密度cnn支援slamフロントエンドを開発し,屋内および屋外のデータセットで評価する。
論文 参考訳(メタデータ) (2021-04-01T15:43:28Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - RIFLE: Backpropagation in Depth for Deep Transfer Learning through
Re-Initializing the Fully-connected LayEr [60.07531696857743]
事前訓練されたモデルを用いたディープ畳み込みニューラルネットワーク(CNN)の微調整は、より大きなデータセットから学習した知識をターゲットタスクに転送するのに役立つ。
転送学習環境におけるバックプロパゲーションを深める戦略であるRIFLEを提案する。
RIFLEは、深いCNN層の重み付けに意味のあるアップデートをもたらし、低レベルの機能学習を改善する。
論文 参考訳(メタデータ) (2020-07-07T11:27:43Z) - Cascaded Deep Video Deblurring Using Temporal Sharpness Prior [88.98348546566675]
提案アルゴリズムは主に,中間潜水フレームと潜水フレームの復元ステップから光フローを推定する。
まず、中間潜伏フレームから光フローを推定し、推定した光フローに基づいて潜伏フレームを復元する深部CNNモデルを開発する。
ビデオデブロアリングのドメイン知識を探索することで、深層CNNモデルをよりコンパクトで効率的なものにすることができることを示す。
論文 参考訳(メタデータ) (2020-04-06T09:13:49Z) - What Deep CNNs Benefit from Global Covariance Pooling: An Optimization
Perspective [102.37204254403038]
我々は最適化の観点から、GCPの深いCNNのメリットを理解する試みを行っている。
GCPは最適化のランドスケープをよりスムーズにし、勾配をより予測できることを示す。
多様なタスクに対して様々な深部CNNモデルを用いて広範な実験を行い,その結果を強く支持する。
論文 参考訳(メタデータ) (2020-03-25T07:00:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。