論文の概要: WGANVO: Monocular Visual Odometry based on Generative Adversarial
Networks
- arxiv url: http://arxiv.org/abs/2007.13704v1
- Date: Mon, 27 Jul 2020 17:31:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 09:03:09.671624
- Title: WGANVO: Monocular Visual Odometry based on Generative Adversarial
Networks
- Title(参考訳): WGANVO: 生成的対向ネットワークに基づく単眼視覚計測
- Authors: Javier Cremona, Lucas Uzal, Taih\'u Pire
- Abstract要約: WGANVOはディープラーニングに基づくモノクラービジュアルオドメトリー手法である。
特に、ニューラルネットワークは、画像対からポーズ推定を回帰するように訓練される。
この方法は、事前の知識も余分な情報も必要とせず、シーンの絶対規模を回復することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work we present WGANVO, a Deep Learning based monocular Visual
Odometry method. In particular, a neural network is trained to regress a pose
estimate from an image pair. The training is performed using a semi-supervised
approach. Unlike geometry based monocular methods, the proposed method can
recover the absolute scale of the scene without neither prior knowledge nor
extra information. The evaluation of the system is carried out on the
well-known KITTI dataset where it is shown to work in real time and the
accuracy obtained is encouraging to continue the development of Deep Learning
based methods.
- Abstract(参考訳): 本稿では,深層学習に基づく単眼視覚オドメトリ法であるwganvoを提案する。
特に、ニューラルネットワークは、画像対からポーズ推定を回帰するように訓練される。
トレーニングは半教師付きアプローチで実施される。
幾何学に基づく単眼法とは異なり,提案手法では事前知識も余分な情報も必要とせず,シーンの絶対スケールを復元することができる。
システム評価は、リアルタイムに動作することを示すKITTIデータセット上で行われ、得られた精度はディープラーニングベースの手法の開発を継続することを奨励している。
関連論文リスト
- Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond [61.18736646013446]
その驚くべき振る舞いをより深く理解するために、トレーニングされたニューラルネットワークの単純かつ正確なモデルの有用性について検討する。
3つのケーススタディで、様々な顕著な現象に関する新しい経験的洞察を導き出すためにどのように適用できるかを説明します。
論文 参考訳(メタデータ) (2024-10-31T22:54:34Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - SelfTune: Metrically Scaled Monocular Depth Estimation through
Self-Supervised Learning [53.78813049373321]
本稿では,事前学習した教師付き単分子深度ネットワークに対する自己教師付き学習手法を提案する。
本手法は移動ロボットナビゲーションなどの様々な応用に有用であり,多様な環境に適用可能である。
論文 参考訳(メタデータ) (2022-03-10T12:28:42Z) - X-Distill: Improving Self-Supervised Monocular Depth via Cross-Task
Distillation [69.9604394044652]
そこで本研究では,クロスタスク知識蒸留による単眼深度の自己指導的訓練を改善する手法を提案する。
トレーニングでは,事前訓練されたセマンティックセグメンテーション教師ネットワークを使用し,そのセマンティック知識を深度ネットワークに転送する。
提案手法の有効性をKITTIベンチマークで評価し,最新技術と比較した。
論文 参考訳(メタデータ) (2021-10-24T19:47:14Z) - Self-Supervised Monocular Depth Estimation with Internal Feature Fusion [12.874712571149725]
深度推定のための自己教師付き学習は、画像列の幾何学を用いて監督する。
そこで本研究では,ダウンおよびアップサンプリングの手順で意味情報を利用することのできる,新しい深度推定ネットワークDIFFNetを提案する。
論文 参考訳(メタデータ) (2021-10-18T17:31:11Z) - Generalizing to the Open World: Deep Visual Odometry with Online
Adaptation [27.22639812204019]
本稿では,シーン非依存な幾何計算とベイズ推論の助けを借りて,ディープvoのオンライン適応フレームワークを提案する。
本手法は,自己監視型VO法における最先端の一般化能力を実現する。
論文 参考訳(メタデータ) (2021-03-29T02:13:56Z) - Deep Learning based Monocular Depth Prediction: Datasets, Methods and
Applications [31.06326714016336]
RGB画像から深度を推定することで、屋内のローカライゼーション、高さ推定、同時ローカライゼーションとマッピングなど、多くのコンピュータビジョンタスクが容易になる。
近年,深層学習技術の急速な発展により,単眼深度推定が大きな進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-09T01:03:13Z) - Semantically-Guided Representation Learning for Self-Supervised
Monocular Depth [40.49380547487908]
本稿では,自己教師付き表現学習を指導するために,事前訓練型セマンティックセマンティック・セマンティクス・ネットワークを利用した新しいアーキテクチャを提案する。
本手法は,全画素,細粒度細部,意味カテゴリーごとの自己教師型単眼深度予測のための技術の現状を改善した。
論文 参考訳(メタデータ) (2020-02-27T18:40:10Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。