論文の概要: Sparse SPN: Depth Completion from Sparse Keypoints
- arxiv url: http://arxiv.org/abs/2212.00987v1
- Date: Fri, 2 Dec 2022 05:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 16:49:10.812696
- Title: Sparse SPN: Depth Completion from Sparse Keypoints
- Title(参考訳): スパースSPN:スパースキーポイントからの深さ補完
- Authors: Yuqun Wu, Jae Yong Lee, Derek Hoiem
- Abstract要約: 長期的なゴールは、画像ベースの深度補完を使用して、スパースポイントクラウドから3Dモデルを作成することである。
我々は、CSPNをマルチスケールの予測と拡張カーネルで拡張し、キーポイントサンプリング深度をより良くする。
また、NYUv2でトレーニングされたモデルが、スパースSfM点を完結させることで、驚くほど良い点雲をETH3D上で生成することを示した。
- 参考スコア(独自算出の注目度): 17.26885039864854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our long term goal is to use image-based depth completion to quickly create
3D models from sparse point clouds, e.g. from SfM or SLAM. Much progress has
been made in depth completion. However, most current works assume well
distributed samples of known depth, e.g. Lidar or random uniform sampling, and
perform poorly on uneven samples, such as from keypoints, due to the large
unsampled regions. To address this problem, we extend CSPN with multiscale
prediction and a dilated kernel, leading to much better completion of
keypoint-sampled depth. We also show that a model trained on NYUv2 creates
surprisingly good point clouds on ETH3D by completing sparse SfM points.
- Abstract(参考訳): 私たちの長期的な目標は、画像ベースの深度補完を使用して、SfMやSLAMなど、スパーポイントクラウドから3Dモデルを簡単に作成することです。
奥行きの完成には多くの進歩があった。
しかし、現在のほとんどの研究は、Lidarやランダムな均一サンプリングのような既知の深さの十分に分散したサンプルを仮定し、キーポイントのような不均一なサンプルでは、大きなアンサンプされた領域のためにうまく動作しない。
この問題に対処するため、CSPNをマルチスケールの予測と拡張カーネルで拡張し、キーポイントサンプリング深度をはるかに改善する。
また、NYUv2でトレーニングされたモデルが、スパースSfM点を完結させることで、驚くほど良い点雲をETH3D上で生成することを示した。
関連論文リスト
- LoopSparseGS: Loop Based Sparse-View Friendly Gaussian Splatting [18.682864169561498]
LoopSparseGSは、疎結合なビュー合成タスクのためのループベースの3DGSフレームワークである。
Sparse-Friended Smpling (SFS) 戦略を導入し,ガウス楕円体を過剰に処理し,画素誤差が大きくなった。
4つのデータセットの実験により、LoopSparseGSはスパース・インプット・ノベルビューの合成において既存の最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-08-01T03:26:50Z) - PointRegGPT: Boosting 3D Point Cloud Registration using Generative Point-Cloud Pairs for Training [90.06520673092702]
生成点クラウドペアを用いた3Dポイントクラウドの登録をトレーニングのために促進するPointRegGPTを提案する。
我々の知る限り、これは屋内のクラウド登録のためのリアルなデータ生成を探求する最初の生成的アプローチである。
論文 参考訳(メタデータ) (2024-07-19T06:29:57Z) - NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth
Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。
セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。
結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-22T11:48:06Z) - Sparse2Dense: Learning to Densify 3D Features for 3D Object Detection [85.08249413137558]
LiDARが生成する点雲は、最先端の3Dオブジェクト検出器の主要な情報源である。
小さい、遠く、不完全な点の少ない物体は、しばしば検出するのが困難である。
Sparse2Denseは、潜在空間における点雲の密度化を学習することで、3D検出性能を効率的に向上する新しいフレームワークである。
論文 参考訳(メタデータ) (2022-11-23T16:01:06Z) - SketchSampler: Sketch-based 3D Reconstruction via View-dependent Depth
Sampling [75.957103837167]
1枚のスケッチ画像に基づいて3次元形状を再構成することは、スパースで不規則なスケッチと正規の高密度な3次元形状との間に大きな領域ギャップがあるため困難である。
既存の作品では、3D座標を直接予測するためにスケッチから抽出されたグローバルな特徴を活用しようとするが、通常は入力スケッチに忠実でない細部を失う。
論文 参考訳(メタデータ) (2022-08-14T16:37:51Z) - SparseFormer: Attention-based Depth Completion Network [2.9434930072968584]
SparseFormerというトランスフォーマーブロックを導入し、3Dランドマークと深い視覚的特徴を融合して深い深度を作り出す。
SparseFormerはグローバルな受容場を持ち、低密度で一様でないランドマークを持つディープコンプリートに特に有効である。
3Dランドマーク間の奥行き外乱の問題に対処するため,スパースランドマーク間の注意を通して外乱をフィルタリングするトレーニング可能なリファインメントモジュールを導入する。
論文 参考訳(メタデータ) (2022-06-09T15:08:24Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - Sparse Depth Completion with Semantic Mesh Deformation Optimization [4.03103540543081]
本稿では、RGB画像とスパース深度サンプルを入力とし、完全な深度マップを予測し、最適化後のニューラルネットワークを提案する。
評価結果は,屋内および屋外両方のデータセットにおいて,既存の成果を一貫して上回る結果となった。
論文 参考訳(メタデータ) (2021-12-10T13:01:06Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - DELTAS: Depth Estimation by Learning Triangulation And densification of
Sparse points [14.254472131009653]
多視点ステレオ (MVS) は, 能動深度センシングの精度と単眼深度推定の実用性の間の黄金平均値である。
3次元畳み込みニューラルネットワーク(CNN)を用いたコストボリュームベースのアプローチにより、MVSシステムの精度が大幅に向上した。
まず、(a)興味点の記述子を検出して評価し、次に(b)興味点の小さな集合をマッチングして三角測量し、最後に(c)CNNを用いてこのスパースな3D点の集合を密度化することで、効率的な深さ推定手法を提案する。
論文 参考訳(メタデータ) (2020-03-19T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。