Fugu-MT 論文翻訳(概要): PLG-IN: Pluggable Geometric Consistency Loss with Wasserstein Distance in Monocular Depth Estimation

論文の概要: PLG-IN: Pluggable Geometric Consistency Loss with Wasserstein Distance in Monocular Depth Estimation

arxiv url: http://arxiv.org/abs/2006.02068v2
Date: Thu, 6 Aug 2020 02:55:13 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-25 18:30:55.151894
Title: PLG-IN: Pluggable Geometric Consistency Loss with Wasserstein Distance in Monocular Depth Estimation
Title（参考訳）: plg-in:単眼深度推定におけるwasserstein距離を用いたプラグ可能な幾何整合損失
Authors: Noriaki Hirose, Satoshi Koide, Keisuke Kawano, Ruho Kondo
Abstract要約: カメラ画像における幾何学的不整合をペナル化するための新しい目的を提案する。我々の目的は、異なるカメラポーズの画像から推定される2点の雲間のワッサースタイン距離を用いて設計されている。
参考スコア（独自算出の注目度）: 14.06995367117218
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a novel objective for penalizing geometric inconsistencies to improve the depth and pose estimation performance of monocular camera images. Our objective is designed using the Wasserstein distance between two point clouds, estimated from images with different camera poses. The Wasserstein distance can impose a soft and symmetric coupling between two point clouds, which suitably maintains geometric constraints and results in a differentiable objective. By adding our objective to the those of other state-of-the-art methods, we can effectively penalize geometric inconsistencies and obtain highly accurate depth and pose estimations. Our proposed method is evaluated using the KITTI dataset.
Abstract（参考訳）: 単眼カメラ画像の深度とポーズ推定性能を改善するために, 幾何学的不整合をペナル化するための新しい目的を提案する。対象は,カメラポーズの異なる画像から推定した2点雲間のwasserstein距離を用いて設計した。ワッサーシュタイン距離は2点の雲の間にソフトで対称な結合を課し、幾何学的制約を適切に維持し、微分可能な目的を与える。他の最先端手法に目的を加えることで、幾何学的不整合を効果的に罰し、高精度な深度とポーズ推定を得ることができる。提案手法は,KITTIデータセットを用いて評価する。

関連論文リスト

RePoseD: Efficient Relative Pose Estimation With Known Depth Information [45.40994214285799]
本稿では,2つのカメラの相対的なポーズを,関連する単眼深度に対応する点対応から推定する新しい枠組みを提案する。新しいソルバは、スピードと精度の点で最先端のディープ・アウェア・ソルバより優れている。
論文参考訳（メタデータ） (2025-01-13T23:13:33Z)
Relative Pose Estimation through Affine Corrections of Monocular Depth Priors [69.59216331861437]
本研究では,独立なアフィン(スケールとシフト)のあいまいさを明示的に考慮した相対ポーズ推定のための3つの解法を開発した。提案する解法と古典的点ベース解法とエピポーラ制約を組み合わせたハイブリッド推定パイプラインを提案する。
論文参考訳（メタデータ） (2025-01-09T18:58:30Z)
A Simple yet Effective Test-Time Adaptation for Zero-Shot Monocular Metric Depth Estimation [46.037640130193566]
センサや低分解能LiDARなどの技術によって提供される3Dポイントや、IMUが提示したポーズによる構造移動を用いて、奥行きの予測を再現する新しい手法を提案する。実験では, ゼロショット単角距離推定法, 微調整法と比較しての競合性, 深度補修法よりも頑健さが向上した。
論文参考訳（メタデータ） (2024-12-18T17:50:15Z)
GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion [7.588468985212172]
計量単分子深度推定の一般化は、その不適切な性質のために重要な課題となる。本稿では,様々なカメラ設定の整合性を維持する新しい標準表現を提案する。また,物体の大きさや垂直位置の手がかりによって推定される深度を適応的かつ確率的に融合する新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (2024-12-08T22:04:34Z)
SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。 SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文参考訳（メタデータ） (2024-07-07T06:52:51Z)
Metric3Dv2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.28509379811084]
Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。距離深度推定と表面正規度推定の両方の解を提案する。本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文参考訳（メタデータ） (2024-03-22T02:30:46Z)
DVMNet++: Rethinking Relative Pose Estimation for Unseen Objects [59.51874686414509]
既存のアプローチでは、通常、接地構造オブジェクト境界ボックスと、多数の離散仮説を持つ近似3次元回転を用いて3次元翻訳を予測している。本稿では,1回のパスで相対オブジェクトのポーズを計算するDeep Voxel Matching Network (DVMNet++)を提案する。提案手法は,最先端手法と比較して計算コストの低い新しいオブジェクトに対して,より正確な相対的ポーズ推定を行う。
論文参考訳（メタデータ） (2024-03-20T15:41:32Z)
DepthP+P: Metric Accurate Monocular Depth Estimation using Planar and Parallax [0.0]
現在の自己監督型単眼深度推定法は主に、カメラの動きを表す剛体の動きを推定することに基づいている。本稿では,従来の平面パララックスパラダイムに従えば,メートル法で出力を推定する手法であるDepthP+Pを提案する。
論文参考訳（メタデータ） (2023-01-05T14:53:21Z)
On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文参考訳（メタデータ） (2022-09-19T03:46:13Z)
Monocular 3D Object Detection with Depth from Motion [74.29588921594853]
我々は、正確な物体深度推定と検出にカメラエゴモーションを利用する。我々のフレームワークはDfM(Depth from Motion)と呼ばれ、2D画像の特徴を3D空間に持ち上げて3Dオブジェクトを検出する。我々のフレームワークは、KITTIベンチマークにおいて最先端の手法よりも大きなマージンで優れている。
論文参考訳（メタデータ） (2022-07-26T15:48:46Z)
Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文参考訳（メタデータ） (2022-04-26T18:00:08Z)
Deep Two-View Structure-from-Motion Revisited [83.93809929963969]
2次元構造移動(SfM)は3次元再構成と視覚SLAMの基礎となる。古典パイプラインの適切性を活用することで,深部2視点sfmの問題を再検討することを提案する。本手法は,1)2つのフレーム間の密対応を予測する光フロー推定ネットワーク,2)2次元光フロー対応から相対カメラポーズを計算する正規化ポーズ推定モジュール,3)エピポーラ幾何を利用して探索空間を縮小し,密対応を洗練し,相対深度マップを推定するスケール不変深さ推定ネットワークからなる。
論文参考訳（メタデータ） (2021-04-01T15:31:20Z)
Robust Consistent Video Depth Estimation [65.53308117778361]
本稿では,単眼映像からカメラのカメラポーズと密集した深度マップを推定するアルゴリズムを提案する。本手法は,(1)低周波大規模アライメントのためのフレキシブルな変形-スプラインと(2)細部奥行き詳細の高周波アライメントのための幾何認識深度フィルタリングとを組み合わせた手法である。従来の手法とは対照的に, カメラのポーズを入力として必要とせず, かなりの音量, 揺動, 動きのぼやき, 転がりシャッター変形を含む携帯のハンドヘルドキャプチャに頑健な再構成を実現する。
論文参考訳（メタデータ） (2020-12-10T18:59:48Z)
Variational Monocular Depth Estimation for Reliability Prediction [12.951621755732544]
教師付き学習手法の代替として,単眼深度推定のための自己教師付き学習が広く研究されている。従来はモデル構造の変更による深度推定の精度向上に成功している。本稿では, 単眼深度推定のための変分モデルを理論的に定式化し, 推定深度画像の信頼性を推定する。
論文参考訳（メタデータ） (2020-11-24T06:23:51Z)
SynDistNet: Self-Supervised Monocular Fisheye Camera Distance Estimation Synergized with Semantic Segmentation for Autonomous Driving [37.50089104051591]
モノクル深度推定のための最先端の自己教師型学習アプローチは、通常、スケールの曖昧さに悩まされる。本稿では,魚眼カメラ画像とピンホールカメラ画像の自己教師付き単眼距離推定を改善するための,新しいマルチタスク学習手法を提案する。
論文参考訳（メタデータ） (2020-08-10T10:52:47Z)
AcED: Accurate and Edge-consistent Monocular Depth Estimation [0.0]
単一画像深度推定は難しい問題である。完全に微分可能な順序回帰を定式化し、エンドツーエンドでネットワークを訓練する。深度補正のための画素ごとの信頼度マップ計算も提案した。
論文参考訳（メタデータ） (2020-06-16T15:21:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。