論文の概要: Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation
- arxiv url: http://arxiv.org/abs/2008.07130v1
- Date: Mon, 17 Aug 2020 07:40:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 04:03:13.194065
- Title: Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation
- Title(参考訳): 周期反転:単眼蒸留による自己教師付き深層ステレオ
- Authors: Filippo Aleotti, Fabio Tosi, Li Zhang, Matteo Poggi, Stefano Mattoccia
- Abstract要約: 多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
- 参考スコア(独自算出の注目度): 51.714092199995044
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many fields, self-supervised learning solutions are rapidly evolving and
filling the gap with supervised approaches. This fact occurs for depth
estimation based on either monocular or stereo, with the latter often providing
a valid source of self-supervision for the former. In contrast, to soften
typical stereo artefacts, we propose a novel self-supervised paradigm reversing
the link between the two. Purposely, in order to train deep stereo networks, we
distill knowledge through a monocular completion network. This architecture
exploits single-image clues and few sparse points, sourced by traditional
stereo algorithms, to estimate dense yet accurate disparity maps by means of a
consensus mechanism over multiple estimations. We thoroughly evaluate with
popular stereo datasets the impact of different supervisory signals showing how
stereo networks trained with our paradigm outperform existing self-supervised
frameworks. Finally, our proposal achieves notable generalization capabilities
dealing with domain shift issues. Code available at
https://github.com/FilippoAleotti/Reversing
- Abstract(参考訳): 多くの分野で、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
この事実は単眼またはステレオに基づく深さ推定において起こり、後者はしばしば前者に対して有効な自己スーパービジョンの源を提供する。
対照的に,典型的なステレオアーティファクトをソフト化するために,両者のリンクを逆転する新しい自己教師付きパラダイムを提案する。
目的,深層ステレオネットワークを訓練するために,単分子完全ネットワークを通じて知識を抽出する。
このアーキテクチャは、単一の画像の手がかりと、従来のステレオアルゴリズムによって導出されるスパースポイントを生かし、複数の推定に対するコンセンサス機構を用いて、密度が高く正確な不均等写像を推定する。
一般的なステレオデータセットを用いて、ステレオネットワークが既存の自己管理フレームワークより優れていることを示す、さまざまな監視信号の影響を徹底的に評価する。
最後に、ドメインシフト問題に対処する顕著な一般化機能を実現する。
https://github.com/FilippoAleotti/Reversingで公開されているコード
関連論文リスト
- Learning Monocular Depth Estimation via Selective Distillation of Stereo
Knowledge [34.380048111601894]
本研究では,各画素のプロキシ不均一度マップと推定深度マップとを最適に選択するように訓練された2つのバイナリマスクを学習するデコーダ (MaskDecoder) を設計する。
学習したマスクは、推定深度を強制するために別のデコーダ(DepthDecoder)に送られる。
自己およびプロキシによる単分子深度推定における最先端性能の検証実験を行った。
論文 参考訳(メタデータ) (2022-05-18T00:34:28Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - Revisiting Domain Generalized Stereo Matching Networks from a Feature
Consistency Perspective [65.37571681370096]
両視点にまたがる単純な画素単位のコントラスト学習を提案する。
ドメイン間の立体的特徴一貫性をよりよく維持するために、立体選択的白化損失を導入する。
提案手法は,複数の最先端ネットワークよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T11:21:41Z) - SelfTune: Metrically Scaled Monocular Depth Estimation through
Self-Supervised Learning [53.78813049373321]
本稿では,事前学習した教師付き単分子深度ネットワークに対する自己教師付き学習手法を提案する。
本手法は移動ロボットナビゲーションなどの様々な応用に有用であり,多様な環境に適用可能である。
論文 参考訳(メタデータ) (2022-03-10T12:28:42Z) - Deep Multi-View Stereo gone wild [12.106051690920266]
ディープマルチビューステレオ(ディープMSV)メソッドは、単純なデータセットで広く開発され、比較されています。
本稿では,インターネット写真収集作業において,制御されたシナリオで到達した結論が有効かどうかを問う。
ネットワークアーキテクチャ,トレーニングデータ,監督という,深層MSV手法の3つの側面から評価手法を提案し,その影響を検討する。
論文 参考訳(メタデータ) (2021-04-30T17:07:17Z) - The Temporal Opportunist: Self-Supervised Multi-Frame Monocular Depth [28.06671063873351]
ManyDepth は密度深度推定への適応的なアプローチである。
信頼性が低いと判断された場合、ネットワークがコストを無視するように促す新しい一貫性損失を示す。
論文 参考訳(メタデータ) (2021-04-29T17:53:42Z) - H-Net: Unsupervised Attention-based Stereo Depth Estimation Leveraging
Epipolar Geometry [4.968452390132676]
本稿では,教師なしステレオ深度推定のためのディープラーニングフレームワークであるH-Netを紹介する。
初めて、Siameseオートエンコーダアーキテクチャが深さ推定に使用されます。
本手法は,最先端の非監視ステレオ深度推定法を上回っている。
論文 参考訳(メタデータ) (2021-04-22T19:16:35Z) - Self-supervised Learning of Depth Inference for Multi-view Stereo [36.320984882009775]
マルチビューステレオネットワークのための自己監視型学習フレームワークを提案する。
まず、教師なし学習フレームワークの下で、深度マップを初期擬似ラベルとして見積もることから始める。
我々は注意深く設計されたパイプラインを用いて初期擬似ラベルを洗練する。
論文 参考訳(メタデータ) (2021-04-07T07:45:02Z) - On the confidence of stereo matching in a deep-learning era: a
quantitative evaluation [124.09613797008099]
ステレオマッチングにおける信頼度推定の分野における10年以上の発展を概観する。
本研究では,異なるステレオアルゴリズムのプールに適用した場合と,最先端のディープステレオネットワークと組み合わせる場合とで,各測定値の異なる挙動について検討する。
論文 参考訳(メタデータ) (2021-01-02T11:40:17Z) - Don't Forget The Past: Recurrent Depth Estimation from Monocular Video [92.84498980104424]
私たちは3つの異なる種類の深さ推定を共通のフレームワークに組み込んだ。
提案手法は, 時系列の深度マップを生成する。
モノクロビデオにのみ適用したり、異なる種類のスパース深度パターンと組み合わせたりすることができる。
論文 参考訳(メタデータ) (2020-01-08T16:50:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。