論文の概要: Improved Point Transformation Methods For Self-Supervised Depth
Prediction
- arxiv url: http://arxiv.org/abs/2102.09142v1
- Date: Thu, 18 Feb 2021 03:42:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 16:23:11.285549
- Title: Improved Point Transformation Methods For Self-Supervised Depth
Prediction
- Title(参考訳): 自己監督深度予測のための点変換法の改良
- Authors: Chen Ziwen, Zixuan Guo, Jerod Weinman
- Abstract要約: ステレオ画像対やエゴモーション画像対が与えられた場合、単眼深度推定の教師なし学習の一般的な成功方法は、学習した深度予測による画像再構成の品質を測定することである。
本稿では,変換後の点を新しい視点に正しく効率的に処理するzブッフィングアルゴリズムを提案する。
このアルゴリズムは、機械学習ライブラリの典型的なオペレーターによって実装されているため、差別化を自動サポートした既存の教師なし深度学習フレームワークに組み込むことができる。
- 参考スコア(独自算出の注目度): 4.103701929881022
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given stereo or egomotion image pairs, a popular and successful method for
unsupervised learning of monocular depth estimation is to measure the quality
of image reconstructions resulting from the learned depth predictions.
Continued research has improved the overall approach in recent years, yet the
common framework still suffers from several important limitations, particularly
when dealing with points occluded after transformation to a novel viewpoint.
While prior work has addressed this problem heuristically, this paper
introduces a z-buffering algorithm that correctly and efficiently handles
occluded points. Because our algorithm is implemented with operators typical of
machine learning libraries, it can be incorporated into any existing
unsupervised depth learning framework with automatic support for
differentiation. Additionally, because points having negative depth after
transformation often signify erroneously shallow depth predictions, we
introduce a loss function to penalize this undesirable behavior explicitly.
Experimental results on the KITTI data set show that the z-buffer and negative
depth loss both improve the performance of a state of the art depth-prediction
network.
- Abstract(参考訳): ステレオ画像対やエゴモーション画像対が与えられた場合、単眼深度推定の教師なし学習の一般的な成功方法は、学習した深度予測による画像再構成の品質を測定することである。
近年の継続的な研究により、全体的なアプローチが改善されているが、共通フレームワークには依然としていくつかの重要な制限が残っている。
先行研究はヒューリスティックにこの問題に対処しているが,本稿ではオクルード点を正しく効率的に処理するzブッフィングアルゴリズムを提案する。
このアルゴリズムは、機械学習ライブラリの典型的なオペレーターによって実装されているため、差別化を自動サポートした既存の教師なし深度学習フレームワークに組み込むことができる。
さらに、変換後の負の深さを持つ点はしばしば誤った浅みの予測を示すため、この望ましくない振舞いを明示する損失関数を導入する。
KITTIデータセットの実験結果から,zバッファと負の深度損失はともに,アート深度予測ネットワークの性能を向上させることが示された。
関連論文リスト
- Adaptive Learning for Multi-view Stereo Reconstruction [6.635583283522551]
まず,深度に基づくMVS手法において,既存の損失関数の特性を解析する。
そこで我々は,真と予測される深さの確率分布の違いを狭めることができる適応ワッサースタイン損失という新しい損失関数を提案する。
DTU, Tanks and Temples, BlendedMVS などの異なるベンチマーク実験により,適応的なワッサーシュタイン損失とオフセットモジュールを用いた提案手法が最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2024-04-08T04:13:35Z) - Depth Estimation Algorithm Based on Transformer-Encoder and Feature
Fusion [3.490784807576072]
この研究は、自然言語処理の成功で有名なトランスフォーマーモデルを採用し、深度推定タスクのための視覚データにおける複雑な空間関係をキャプチャする。
この研究の重要な革新は、構造類似度指標尺度(SSIM)と平均正方形誤差(MSE)を組み合わせた複合損失関数の統合である。
本研究は,MSEに基づく損失によく見られる過度な平滑化の課題に対処し,精度だけでなく,入力画像との整合性も維持する深度マップの予測能力を向上させる。
論文 参考訳(メタデータ) (2024-03-03T02:10:00Z) - AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation [51.143540967290114]
本研究では,教師なし深度計算と推定のために,従来不可能であった幾何拡張の幅広い範囲をアンロックする手法を提案する。
これは、出力深さの座標への幾何変換を反転、あるいはアンドウイング(undo''-ing)し、深度マップを元の参照フレームに戻すことで達成される。
論文 参考訳(メタデータ) (2023-10-15T05:15:45Z) - VA-DepthNet: A Variational Approach to Single Image Depth Prediction [163.14849753700682]
VA-DepthNetは、単一画像深度予測問題に対する単純で効果的で正確なディープニューラルネットワークアプローチである。
本論文は,複数のベンチマークデータセットに対する広範囲な評価とアブレーション解析により提案手法の有用性を実証する。
論文 参考訳(メタデータ) (2023-02-13T17:55:58Z) - Robust Depth Completion with Uncertainty-Driven Loss Functions [60.9237639890582]
本研究では,不確実性による損失関数を導入し,深度補修の堅牢性を改善し,深度補修の不確実性に対処する。
提案手法は,KITTI深度評価ベンチマークでテストされ,MAE, IMAE, IRMSEの計測値を用いて最先端のロバスト性性能を達成した。
論文 参考訳(メタデータ) (2021-12-15T05:22:34Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Towards Better Generalization: Joint Depth-Pose Learning without PoseNet [36.414471128890284]
自己教師型共同深層学習におけるスケール不整合の本質的問題に対処する。
既存の手法の多くは、全ての入力サンプルで一貫した深さとポーズを学習できると仮定している。
本稿では,ネットワーク推定からスケールを明示的に切り離す新しいシステムを提案する。
論文 参考訳(メタデータ) (2020-04-03T00:28:09Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z) - Beyond Dropout: Feature Map Distortion to Regularize Deep Neural
Networks [107.77595511218429]
本稿では,ディープニューラルネットワークの中間層に関連する実験的なRademacher複雑性について検討する。
上記の問題に対処するための特徴歪み法(Disout)を提案する。
より高い試験性能を有するディープニューラルネットワークを作製するための特徴写像歪みの優位性を解析し、実証した。
論文 参考訳(メタデータ) (2020-02-23T13:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。