論文の概要: PLG-IN: Pluggable Geometric Consistency Loss with Wasserstein Distance
in Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2006.02068v2
- Date: Thu, 6 Aug 2020 02:55:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 18:30:55.151894
- Title: PLG-IN: Pluggable Geometric Consistency Loss with Wasserstein Distance
in Monocular Depth Estimation
- Title(参考訳): plg-in:単眼深度推定におけるwasserstein距離を用いたプラグ可能な幾何整合損失
- Authors: Noriaki Hirose, Satoshi Koide, Keisuke Kawano, Ruho Kondo
- Abstract要約: カメラ画像における幾何学的不整合をペナル化するための新しい目的を提案する。
我々の目的は、異なるカメラポーズの画像から推定される2点の雲間のワッサースタイン距離を用いて設計されている。
- 参考スコア(独自算出の注目度): 14.06995367117218
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel objective for penalizing geometric inconsistencies to
improve the depth and pose estimation performance of monocular camera images.
Our objective is designed using the Wasserstein distance between two point
clouds, estimated from images with different camera poses. The Wasserstein
distance can impose a soft and symmetric coupling between two point clouds,
which suitably maintains geometric constraints and results in a differentiable
objective. By adding our objective to the those of other state-of-the-art
methods, we can effectively penalize geometric inconsistencies and obtain
highly accurate depth and pose estimations. Our proposed method is evaluated
using the KITTI dataset.
- Abstract(参考訳): 単眼カメラ画像の深度とポーズ推定性能を改善するために, 幾何学的不整合をペナル化するための新しい目的を提案する。
対象は,カメラポーズの異なる画像から推定した2点雲間のwasserstein距離を用いて設計した。
ワッサーシュタイン距離は2点の雲の間にソフトで対称な結合を課し、幾何学的制約を適切に維持し、微分可能な目的を与える。
他の最先端手法に目的を加えることで、幾何学的不整合を効果的に罰し、高精度な深度とポーズ推定を得ることができる。
提案手法は,KITTIデータセットを用いて評価する。
関連論文リスト
- FS-Depth: Focal-and-Scale Depth Estimation from a Single Image in Unseen
Indoor Scene [57.26600120397529]
実際の(見えない)屋内シーンの単一の画像から絶対深度マップを予測するのには、長年不適切な問題だった。
本研究では,未確認屋内シーンの単一画像から絶対深度マップを正確に学習するための焦点・スケール深度推定モデルを開発した。
論文 参考訳(メタデータ) (2023-07-27T04:49:36Z) - DepthP+P: Metric Accurate Monocular Depth Estimation using Planar and
Parallax [0.0]
現在の自己監督型単眼深度推定法は主に、カメラの動きを表す剛体の動きを推定することに基づいている。
本稿では,従来の平面パララックスパラダイムに従えば,メートル法で出力を推定する手法であるDepthP+Pを提案する。
論文 参考訳(メタデータ) (2023-01-05T14:53:21Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth
Estimation [77.98526337404412]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - Monocular 3D Object Detection with Depth from Motion [74.29588921594853]
我々は、正確な物体深度推定と検出にカメラエゴモーションを利用する。
我々のフレームワークはDfM(Depth from Motion)と呼ばれ、2D画像の特徴を3D空間に持ち上げて3Dオブジェクトを検出する。
我々のフレームワークは、KITTIベンチマークにおいて最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-07-26T15:48:46Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - Deep Two-View Structure-from-Motion Revisited [83.93809929963969]
2次元構造移動(SfM)は3次元再構成と視覚SLAMの基礎となる。
古典パイプラインの適切性を活用することで,深部2視点sfmの問題を再検討することを提案する。
本手法は,1)2つのフレーム間の密対応を予測する光フロー推定ネットワーク,2)2次元光フロー対応から相対カメラポーズを計算する正規化ポーズ推定モジュール,3)エピポーラ幾何を利用して探索空間を縮小し,密対応を洗練し,相対深度マップを推定するスケール不変深さ推定ネットワークからなる。
論文 参考訳(メタデータ) (2021-04-01T15:31:20Z) - Robust Consistent Video Depth Estimation [65.53308117778361]
本稿では,単眼映像からカメラのカメラポーズと密集した深度マップを推定するアルゴリズムを提案する。
本手法は,(1)低周波大規模アライメントのためのフレキシブルな変形-スプラインと(2)細部奥行き詳細の高周波アライメントのための幾何認識深度フィルタリングとを組み合わせた手法である。
従来の手法とは対照的に, カメラのポーズを入力として必要とせず, かなりの音量, 揺動, 動きのぼやき, 転がりシャッター変形を含む携帯のハンドヘルドキャプチャに頑健な再構成を実現する。
論文 参考訳(メタデータ) (2020-12-10T18:59:48Z) - Variational Monocular Depth Estimation for Reliability Prediction [12.951621755732544]
教師付き学習手法の代替として,単眼深度推定のための自己教師付き学習が広く研究されている。
従来はモデル構造の変更による深度推定の精度向上に成功している。
本稿では, 単眼深度推定のための変分モデルを理論的に定式化し, 推定深度画像の信頼性を推定する。
論文 参考訳(メタデータ) (2020-11-24T06:23:51Z) - SynDistNet: Self-Supervised Monocular Fisheye Camera Distance Estimation
Synergized with Semantic Segmentation for Autonomous Driving [37.50089104051591]
モノクル深度推定のための最先端の自己教師型学習アプローチは、通常、スケールの曖昧さに悩まされる。
本稿では,魚眼カメラ画像とピンホールカメラ画像の自己教師付き単眼距離推定を改善するための,新しいマルチタスク学習手法を提案する。
論文 参考訳(メタデータ) (2020-08-10T10:52:47Z) - AcED: Accurate and Edge-consistent Monocular Depth Estimation [0.0]
単一画像深度推定は難しい問題である。
完全に微分可能な順序回帰を定式化し、エンドツーエンドでネットワークを訓練する。
深度補正のための画素ごとの信頼度マップ計算も提案した。
論文 参考訳(メタデータ) (2020-06-16T15:21:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。