論文の概要: PLG-IN: Pluggable Geometric Consistency Loss with Wasserstein Distance
in Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2006.02068v2
- Date: Thu, 6 Aug 2020 02:55:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 18:30:55.151894
- Title: PLG-IN: Pluggable Geometric Consistency Loss with Wasserstein Distance
in Monocular Depth Estimation
- Title(参考訳): plg-in:単眼深度推定におけるwasserstein距離を用いたプラグ可能な幾何整合損失
- Authors: Noriaki Hirose, Satoshi Koide, Keisuke Kawano, Ruho Kondo
- Abstract要約: カメラ画像における幾何学的不整合をペナル化するための新しい目的を提案する。
我々の目的は、異なるカメラポーズの画像から推定される2点の雲間のワッサースタイン距離を用いて設計されている。
- 参考スコア(独自算出の注目度): 14.06995367117218
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel objective for penalizing geometric inconsistencies to
improve the depth and pose estimation performance of monocular camera images.
Our objective is designed using the Wasserstein distance between two point
clouds, estimated from images with different camera poses. The Wasserstein
distance can impose a soft and symmetric coupling between two point clouds,
which suitably maintains geometric constraints and results in a differentiable
objective. By adding our objective to the those of other state-of-the-art
methods, we can effectively penalize geometric inconsistencies and obtain
highly accurate depth and pose estimations. Our proposed method is evaluated
using the KITTI dataset.
- Abstract(参考訳): 単眼カメラ画像の深度とポーズ推定性能を改善するために, 幾何学的不整合をペナル化するための新しい目的を提案する。
対象は,カメラポーズの異なる画像から推定した2点雲間のwasserstein距離を用いて設計した。
ワッサーシュタイン距離は2点の雲の間にソフトで対称な結合を課し、幾何学的制約を適切に維持し、微分可能な目的を与える。
他の最先端手法に目的を加えることで、幾何学的不整合を効果的に罰し、高精度な深度とポーズ推定を得ることができる。
提案手法は,KITTIデータセットを用いて評価する。
関連論文リスト
- Relative Pose Estimation through Affine Corrections of Monocular Depth Priors [69.59216331861437]
本研究では,独立なアフィン(スケールとシフト)のあいまいさを明示的に考慮した相対ポーズ推定のための3つの解法を開発した。
提案する解法と古典的点ベース解法とエピポーラ制約を組み合わせたハイブリッド推定パイプラインを提案する。
論文 参考訳(メタデータ) (2025-01-09T18:58:30Z) - Foundation Models Meet Low-Cost Sensors: Test-Time Adaptation for Rescaling Disparity for Zero-Shot Metric Depth Estimation [46.037640130193566]
本稿では,低コストセンサや低解像度LiDARなどの技術によって提供される3Dポイントを用いて,奥行き予測を再スケールする手法を提案する。
実験では,他の距離深度推定法との比較と,微調整手法との比較による競合性について検討した。
論文 参考訳(メタデータ) (2024-12-18T17:50:15Z) - GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion [7.588468985212172]
計量単分子深度推定の一般化は、その不適切な性質のために重要な課題となる。
本稿では,様々なカメラ設定の整合性を維持する新しい標準表現を提案する。
また,物体の大きさや垂直位置の手がかりによって推定される深度を適応的かつ確率的に融合する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-12-08T22:04:34Z) - SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - Metric3Dv2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.28509379811084]
Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。
距離深度推定と表面正規度推定の両方の解を提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2024-03-22T02:30:46Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - Monocular 3D Object Detection with Depth from Motion [74.29588921594853]
我々は、正確な物体深度推定と検出にカメラエゴモーションを利用する。
我々のフレームワークはDfM(Depth from Motion)と呼ばれ、2D画像の特徴を3D空間に持ち上げて3Dオブジェクトを検出する。
我々のフレームワークは、KITTIベンチマークにおいて最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-07-26T15:48:46Z) - Deep Two-View Structure-from-Motion Revisited [83.93809929963969]
2次元構造移動(SfM)は3次元再構成と視覚SLAMの基礎となる。
古典パイプラインの適切性を活用することで,深部2視点sfmの問題を再検討することを提案する。
本手法は,1)2つのフレーム間の密対応を予測する光フロー推定ネットワーク,2)2次元光フロー対応から相対カメラポーズを計算する正規化ポーズ推定モジュール,3)エピポーラ幾何を利用して探索空間を縮小し,密対応を洗練し,相対深度マップを推定するスケール不変深さ推定ネットワークからなる。
論文 参考訳(メタデータ) (2021-04-01T15:31:20Z) - Robust Consistent Video Depth Estimation [65.53308117778361]
本稿では,単眼映像からカメラのカメラポーズと密集した深度マップを推定するアルゴリズムを提案する。
本手法は,(1)低周波大規模アライメントのためのフレキシブルな変形-スプラインと(2)細部奥行き詳細の高周波アライメントのための幾何認識深度フィルタリングとを組み合わせた手法である。
従来の手法とは対照的に, カメラのポーズを入力として必要とせず, かなりの音量, 揺動, 動きのぼやき, 転がりシャッター変形を含む携帯のハンドヘルドキャプチャに頑健な再構成を実現する。
論文 参考訳(メタデータ) (2020-12-10T18:59:48Z) - SynDistNet: Self-Supervised Monocular Fisheye Camera Distance Estimation
Synergized with Semantic Segmentation for Autonomous Driving [37.50089104051591]
モノクル深度推定のための最先端の自己教師型学習アプローチは、通常、スケールの曖昧さに悩まされる。
本稿では,魚眼カメラ画像とピンホールカメラ画像の自己教師付き単眼距離推定を改善するための,新しいマルチタスク学習手法を提案する。
論文 参考訳(メタデータ) (2020-08-10T10:52:47Z) - AcED: Accurate and Edge-consistent Monocular Depth Estimation [0.0]
単一画像深度推定は難しい問題である。
完全に微分可能な順序回帰を定式化し、エンドツーエンドでネットワークを訓練する。
深度補正のための画素ごとの信頼度マップ計算も提案した。
論文 参考訳(メタデータ) (2020-06-16T15:21:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。