論文の概要: Deep Online Correction for Monocular Visual Odometry
- arxiv url: http://arxiv.org/abs/2103.10029v1
- Date: Thu, 18 Mar 2021 05:55:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 14:06:37.028366
- Title: Deep Online Correction for Monocular Visual Odometry
- Title(参考訳): 単眼視覚オドメトリーにおける深部オンライン補正
- Authors: Jiaxin Zhang, Wei Sui, Xinggang Wang, Wenming Meng, Hongmei Zhu, Qian
Zhang
- Abstract要約: 本研究では,単眼視能測定のための深層オンライン補正(DOC)フレームワークを提案する。
深度マップと初期ポーズは、自己教師された方法で訓練された畳み込みニューラルネットワーク(CNN)から得られる。
本手法は、KITTI Odometryベンチマークにおける相対変換誤差(RTE)=2.0%で優れた性能を発揮します。
09.
- 参考スコア(独自算出の注目度): 23.124372375670887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we propose a novel deep online correction (DOC) framework for
monocular visual odometry. The whole pipeline has two stages: First, depth maps
and initial poses are obtained from convolutional neural networks (CNNs)
trained in self-supervised manners. Second, the poses predicted by CNNs are
further improved by minimizing photometric errors via gradient updates of poses
during inference phases. The benefits of our proposed method are twofold: 1)
Different from online-learning methods, DOC does not need to calculate gradient
propagation for parameters of CNNs. Thus, it saves more computation resources
during inference phases. 2) Unlike hybrid methods that combine CNNs with
traditional methods, DOC fully relies on deep learning (DL) frameworks. Though
without complex back-end optimization modules, our method achieves outstanding
performance with relative transform error (RTE) = 2.0% on KITTI Odometry
benchmark for Seq. 09, which outperforms traditional monocular VO frameworks
and is comparable to hybrid methods.
- Abstract(参考訳): 本研究では,モノクロ視覚計測のための新しい深層オンライン補正(DOC)フレームワークを提案する。
まず、深度マップと最初のポーズは、自己管理的な方法で訓練された畳み込みニューラルネットワーク(CNN)から得られる。
第2に、cnnが予測するポーズは、推論フェーズ中のポーズの勾配更新による測光誤差を最小化し、さらに改善される。
提案手法の利点は2つある: 1) オンライン学習法と異なり、DOCはCNNのパラメータの勾配伝搬を計算する必要はない。
したがって、推論フェーズ中により多くの計算リソースを節約できる。
2) CNNと従来の手法を組み合わせたハイブリッド手法とは異なり,DOCはディープラーニング(DL)フレームワークに完全に依存している。
複雑なバックエンド最適化モジュールがなくても,提案手法は相対変換誤差 (RTE) = 0% を Seq の KITTI Odometry ベンチマークで達成できる。
従来の単分子VOフレームワークよりも優れており、ハイブリッドメソッドに匹敵する。
関連論文リスト
- What to Do When Your Discrete Optimization Is the Size of a Neural
Network? [24.546550334179486]
ニューラルネットワークを用いた機械学習アプリケーションは、離散最適化問題を解くことを含む。
離散的な設定で使用される古典的なアプローチは、大きなニューラルネットワークに対してうまくスケールしない。
連続経路(CP)法は,前者およびモンテカルロ法(MC)法を純粋に表現し,後者を表現している。
論文 参考訳(メタデータ) (2024-02-15T21:57:43Z) - Layer-wise Adaptive Step-Sizes for Stochastic First-Order Methods for
Deep Learning [8.173034693197351]
深層学習における一階最適化のための新しい階層ごとの適応的なステップサイズ手順を提案する。
提案手法は,ディープニューラルネットワーク(DNN)におけるヘシアン対角ブロックに含まれる層次曲率情報を用いて,各層に対する適応的なステップサイズ(LR)を算出する。
数値実験により、SGDの運動量とAdamWと、提案した層ごとのステップサイズを組み合わせることで、効率的なLRスケジュールを選択できることが示されている。
論文 参考訳(メタデータ) (2023-05-23T04:12:55Z) - Learning from Images: Proactive Caching with Parallel Convolutional
Neural Networks [94.85780721466816]
本稿では,プロアクティブキャッシングのための新しいフレームワークを提案する。
モデルベースの最適化とデータ駆動技術を組み合わせて、最適化問題をグレースケールのイメージに変換する。
数値計算の結果,提案手法は71.6%の計算時間を0.8%のコストで削減できることがわかった。
論文 参考訳(メタデータ) (2021-08-15T21:32:47Z) - Cogradient Descent for Dependable Learning [64.02052988844301]
双線形最適化問題に対処するために,CoGDアルゴリズムに基づく信頼度の高い学習法を提案する。
CoGDは、ある変数がスパーシティ制約を持つ場合の双線形問題を解くために導入された。
また、特徴と重みの関連を分解するためにも使用できるため、畳み込みニューラルネットワーク(CNN)をより良く訓練するための我々の手法をさらに一般化することができる。
論文 参考訳(メタデータ) (2021-06-20T04:28:20Z) - Bilevel Online Adaptation for Out-of-Domain Human Mesh Reconstruction [94.25865526414717]
本稿では,事前に訓練されたヒトメッシュ再構築モデルをドメイン外ストリーミングビデオに適応させるという新たな問題を検討する。
重みプローブと重み更新の2つのステップに全体多対象の最適化プロセスを分割するBilevel Online Adaptationを提案します。
BOAが2つのヒューマンメッシュ再構築ベンチマークで最先端の結果をもたらすことを実証する。
論文 参考訳(メタデータ) (2021-03-30T15:47:58Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - An End-To-End-Trainable Iterative Network Architecture for Accelerated
Radial Multi-Coil 2D Cine MR Image Reconstruction [4.233498905999929]
我々は,複数のレシーバコイルを用いた加速2次元放射状シネMRIの画像再構成のためのCNNアーキテクチャを提案する。
提案手法を学習的・非学習的正規化手法と比較し,提案手法を他のよく知られた再構築手法と比較する。
論文 参考訳(メタデータ) (2021-02-01T11:42:04Z) - Transformer Guided Geometry Model for Flow-Based Unsupervised Visual
Odometry [38.20137500372927]
対画像からの情報を扱う2つのカメラポーズ推定器からなる手法を提案する。
画像シーケンスでは、Transformerライクな構造を採用して、局所的な時間ウィンドウ上にジオメトリモデルを構築する。
対向画像間の関係を利用するために,f2fpe(flow-to-flow pose estimator)を提案する。
論文 参考訳(メタデータ) (2020-12-08T19:39:26Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。