論文の概要: Learning Depth Estimation for Transparent and Mirror Surfaces
- arxiv url: http://arxiv.org/abs/2307.15052v1
- Date: Thu, 27 Jul 2023 17:57:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-28 13:20:37.662355
- Title: Learning Depth Estimation for Transparent and Mirror Surfaces
- Title(参考訳): 透明面とミラー面の学習深度推定
- Authors: Alex Costanzino, Pierluigi Zama Ramirez, Matteo Poggi, Fabio Tosi,
Stefano Mattoccia, Luigi Di Stefano
- Abstract要約: 透明またはミラー(ToM)表面の深さを推定することは、センサー、アルゴリズム、またはディープネットワークにとって難しい課題である。
本稿では,ニューラルネットワークを用いた表面の深度を適切に推定する簡単なパイプラインを提案する。
- 参考スコア(独自算出の注目度): 46.07527228487614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inferring the depth of transparent or mirror (ToM) surfaces represents a hard
challenge for either sensors, algorithms, or deep networks. We propose a simple
pipeline for learning to estimate depth properly for such surfaces with neural
networks, without requiring any ground-truth annotation. We unveil how to
obtain reliable pseudo labels by in-painting ToM objects in images and
processing them with a monocular depth estimation model. These labels can be
used to fine-tune existing monocular or stereo networks, to let them learn how
to deal with ToM surfaces. Experimental results on the Booster dataset show the
dramatic improvements enabled by our remarkably simple proposal.
- Abstract(参考訳): 透明またはミラー(ToM)表面の深さを推定することは、センサー、アルゴリズム、またはディープネットワークにとって難しい課題である。
本稿では,ニューラルネットワークを用いた表面の深度を,地平線アノテーションを必要とせずに正確に推定する簡単なパイプラインを提案する。
画像中のToMオブジェクトをインペイントし、単眼深度推定モデルで処理することで、信頼できる擬似ラベルを得る方法について明らかにする。
これらのラベルは、既存のモノクロまたはステレオネットワークを微調整して、tomサーフェスに対処する方法を学ぶのに使うことができる。
Boosterデータセットの実験結果は、非常に単純な提案によって実現された劇的な改善を示している。
関連論文リスト
- High-Fidelity Mask-free Neural Surface Reconstruction for Virtual Reality [6.987660269386849]
Hi-NeuSは、ニューラル暗黙表面再構成のための新しいレンダリングベースのフレームワークである。
提案手法はNeuSとその変種であるNeuralangeloを用いて検証されている。
論文 参考訳(メタデータ) (2024-09-20T02:07:49Z) - Transparent Object Depth Completion [11.825680661429825]
理解と操作のための透明な物体の認識は、依然として大きな課題である。
深度マップに大きく依存する既存のロボットグリップ法は、その独特の視覚特性のために透明な物体には適さない。
本稿では,一視点RGB-Dに基づく深度推定と多視点深度推定の長所を組み合わせた,透明物体深度補完のためのエンドツーエンドネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-24T07:38:06Z) - RFTrans: Leveraging Refractive Flow of Transparent Objects for Surface
Normal Estimation and Manipulation [50.10282876199739]
本稿では、透明物体の表面正規化と操作のためのRGB-Dに基づくRFTransを提案する。
RFNetは屈折流、物体マスク、境界を予測し、次いでF2Netは屈折流から表面の正常を推定する。
現実のロボットがタスクをつかむと、成功率は83%となり、屈折流が直接シミュレートから現実への移動を可能にすることが証明される。
論文 参考訳(メタデータ) (2023-11-21T07:19:47Z) - Multi-View Stereo Representation Revisit: Region-Aware MVSNet [8.264851594332677]
深層学習に基づく多視点ステレオは,全幾何学的詳細オブジェクトを多視点から再構成するための強力なパラダイムとして登場した。
本研究では, RA-MVSNetを用いて, モデルがより広い範囲の表面を知覚できるように, 点-面間距離の利点を生かし, RA-MVSNetを提案する。
提案するRA-MVSNetは,表面のパッチと仮説平面を関連付けることにより知覚範囲が拡張されるため,パッチアワードである。
論文 参考訳(メタデータ) (2023-04-26T15:17:51Z) - TMO: Textured Mesh Acquisition of Objects with a Mobile Device by using
Differentiable Rendering [54.35405028643051]
スマートフォン1台でテクスチャ化されたメッシュを野生で取得するパイプラインを新たに提案する。
提案手法ではまず,RGBD支援構造を動きから導入し,フィルタした深度マップを作成できる。
我々は,高品質なメッシュを実現するニューラル暗黙表面再構成法を採用する。
論文 参考訳(メタデータ) (2023-03-27T10:07:52Z) - MonoGraspNet: 6-DoF Grasping with a Single RGB Image [73.96707595661867]
6-DoFロボットの把握は長続きするが未解決の問題だ。
近年の手法では3次元ネットワークを用いて深度センサから幾何的把握表現を抽出している。
我々はMonoGraspNetと呼ばれるRGBのみの6-DoFグルーピングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-09-26T21:29:50Z) - Monocular Depth Estimation for Semi-Transparent Volume Renderings [10.496309857650306]
モノクル深度推定ネットワークは、現実世界のシーンではますます信頼性が増している。
本研究では,既存手法の単眼深度推定への適応が半透明ボリュームレンダリングにおいて良好であることを示す。
論文 参考訳(メタデータ) (2022-06-27T13:18:02Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - Adaptive confidence thresholding for monocular depth estimation [83.06265443599521]
本稿では,自己教師付ステレオマッチング法から生成されたステレオ画像の擬似地上真実深度マップを利用する新しい手法を提案する。
擬似地底深度マップの信頼度マップを推定し、不正確な擬似地底深度マップによる性能劣化を緩和する。
実験結果から, 最先端の単分子深度推定法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-09-27T13:26:16Z) - Deep Depth Estimation from Visual-Inertial SLAM [11.814395824799988]
視覚-慣性同時局在マッピングシステム(VI-SLAM)を用いてスパース深度を計算した症例について検討した。
結果として生じる点雲は密度が低く、ノイズがあり、一様でない空間分布を持つ。
我々は、VI-SLAMから得られる重力推定値を用いて、トレーニングデータセットで一般的な向きに入力画像をワープする。
論文 参考訳(メタデータ) (2020-07-31T21:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。