論文の概要: Monocular Depth Estimation with Self-supervised Instance Adaptation
- arxiv url: http://arxiv.org/abs/2004.05821v1
- Date: Mon, 13 Apr 2020 08:32:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 23:24:44.924236
- Title: Monocular Depth Estimation with Self-supervised Instance Adaptation
- Title(参考訳): 自己教師付きインスタンス適応による単眼深度推定
- Authors: Robert McCraith, Lukas Neumann, Andrew Zisserman, Andrea Vedaldi
- Abstract要約: ロボット工学の応用では、ロボットの動作に応じて、シーンの複数のビューが利用可能であるかもしれないし、利用できないかもしれない。
本稿では,市販の自己監督型単分子深度再構成システムをテスト時に複数の画像に拡張する手法を提案する。
- 参考スコア(独自算出の注目度): 138.0231868286184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in self-supervised learning havedemonstrated that it is
possible to learn accurate monoculardepth reconstruction from raw video data,
without using any 3Dground truth for supervision. However, in robotics
applications,multiple views of a scene may or may not be available, depend-ing
on the actions of the robot, switching between monocularand multi-view
reconstruction. To address this mixed setting,we proposed a new approach that
extends any off-the-shelfself-supervised monocular depth reconstruction system
to usemore than one image at test time. Our method builds on astandard prior
learned to perform monocular reconstruction,but uses self-supervision at test
time to further improve thereconstruction accuracy when multiple images are
available.When used to update the correct components of the model, thisapproach
is highly-effective. On the standard KITTI bench-mark, our self-supervised
method consistently outperformsall the previous methods with an average 25%
reduction inabsolute error for the three common setups (monocular, stereoand
monocular+stereo), and comes very close in accuracy whencompared to the
fully-supervised state-of-the-art methods.
- Abstract(参考訳): 近年の自己監督学習の進歩は、3次元の真理を監督に用いることなく、生のビデオデータから正確な単眼深度再構成を学習できることを実証している。
しかし、ロボットアプリケーションでは、シーンの複数のビューが利用可能または利用できない場合があり、ロボットのアクションに依存し、モノクロとマルチビューの再構築を切り替える。
この混合条件に対処するため,本研究では,既成の単眼深度再構成システムをテスト時に複数の画像に拡張する手法を提案する。
本手法は, 単分子再構成を行うために, 非標準的な事前学習に基づいて構築されるが, テスト時に自己超越を用いて, 複数の画像が利用可能になった場合のコンストラクション精度を向上する。
標準のKITTIベンチマークでは, 従来手法よりも平均25%の非絶対誤差(単眼, ステレオ, モノクロ+ステレオ)が常に優れており, 完全教師付き状態での精度は極めて高い。
関連論文リスト
- Leveraging Vision-Centric Multi-Modal Expertise for 3D Object Detection [66.74183705987276]
本稿では, 見習いにやさしいマルチモーダル専門家と時間融合にやさしい蒸留監督を含む,カメラオンリーの見習いモデルを改善するための枠組みを提案する。
これらの改善により、我々のカメラオンリーの見習いVCD-Aは、63.1%のNDSスコアでnuScenesに新しい最先端技術を設定する。
論文 参考訳(メタデータ) (2023-10-24T09:29:26Z) - Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image [85.91935485902708]
ゼロショット単視距離深度モデルの鍵は、大規模データトレーニングと様々なカメラモデルからの距離あいまいさの解消の組合せにあることを示す。
本稿では,あいまいさ問題に明示的に対処し,既存の単分子モデルにシームレスに接続可能な標準カメラ空間変換モジュールを提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2023-07-20T16:14:23Z) - Self-Supervised Monocular Depth Estimation with Self-Reference
Distillation and Disparity Offset Refinement [15.012694052674899]
自己教師付き単分子深度推定を改善するための2つの新しいアイデアを提案する。
我々は,教師が訓練の時期に合わせて更新したパラメータ最適化モデルを用いて,さらなる指導を行う。
我々は,高次特徴量と低次特徴量とのコンテキスト整合性を利用して,マルチスケールの相違オフセットを得る。
論文 参考訳(メタデータ) (2023-02-20T06:28:52Z) - State of the Art in Dense Monocular Non-Rigid 3D Reconstruction [100.9586977875698]
モノクル2D画像から変形可能なシーン(または非剛体)の3D再構成は、コンピュータビジョンとグラフィックスの長年、活発に研究されてきた領域である。
本研究は,モノクラー映像やモノクラービューの集合から,様々な変形可能な物体や複合シーンを高密度に非剛性で再現するための最先端の手法に焦点を当てる。
論文 参考訳(メタデータ) (2022-10-27T17:59:53Z) - RAFT-MSF: Self-Supervised Monocular Scene Flow using Recurrent Optimizer [21.125470798719967]
本稿では,従来の手法に比べて精度が大幅に向上する自己教師付き単眼シーンフロー手法を提案する。
現状の光学フローモデルであるRAFTに基づいて、3次元運動場と不均一マップを同時に更新する新しいデコーダを設計する。
本手法は, 自己監督型単眼シーンフロー法における最先端の精度を実現し, 精度を34.2%向上させる。
論文 参考訳(メタデータ) (2022-05-03T15:43:57Z) - SGM3D: Stereo Guided Monocular 3D Object Detection [62.11858392862551]
SGM3Dと呼ばれるステレオ誘導単分子物体検出ネットワークを提案する。
ステレオ画像から抽出したロバストな3次元特徴を利用して、モノクル画像から得られた特徴を強化する。
本手法は,余分な計算コストを伴わずに性能を向上させるために,他の多くの単分子的手法に統合することができる。
論文 参考訳(メタデータ) (2021-12-03T13:57:14Z) - Self-Supervised Multi-Frame Monocular Scene Flow [61.588808225321735]
自己監督学習に基づくマルチフレーム一眼的シーンフローネットワークを導入。
自己監督学習に基づく単眼的シーンフロー法における最新の精度を観察する。
論文 参考訳(メタデータ) (2021-05-05T17:49:55Z) - SynDistNet: Self-Supervised Monocular Fisheye Camera Distance Estimation
Synergized with Semantic Segmentation for Autonomous Driving [37.50089104051591]
モノクル深度推定のための最先端の自己教師型学習アプローチは、通常、スケールの曖昧さに悩まされる。
本稿では,魚眼カメラ画像とピンホールカメラ画像の自己教師付き単眼距離推定を改善するための,新しいマルチタスク学習手法を提案する。
論文 参考訳(メタデータ) (2020-08-10T10:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。