論文の概要: Hierarchical Prior Mining for Non-local Multi-View Stereo
- arxiv url: http://arxiv.org/abs/2303.09758v1
- Date: Fri, 17 Mar 2023 03:45:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-20 15:39:39.026596
- Title: Hierarchical Prior Mining for Non-local Multi-View Stereo
- Title(参考訳): 非局所マルチビューステレオの階層的事前マイニング
- Authors: Chunlin Ren, Qingshan Xu, Shikun Zhang, Jiaqi Yang
- Abstract要約: マルチビューステレオ(MVS)は、2次元画像の集合からターゲットの3次元形状を復元することを目的としている。
MVSの最近の進歩は、低テクスチャ領域における幾何学の回復のために、非局所構造情報を知覚することが重要であることを示している。
- 参考スコア(独自算出の注目度): 21.70633277840962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a fundamental problem in computer vision, multi-view stereo (MVS) aims at
recovering the 3D geometry of a target from a set of 2D images. Recent advances
in MVS have shown that it is important to perceive non-local structured
information for recovering geometry in low-textured areas. In this work, we
propose a Hierarchical Prior Mining for Non-local Multi-View Stereo (HPM-MVS).
The key characteristics are the following techniques that exploit non-local
information to assist MVS: 1) A Non-local Extensible Sampling Pattern (NESP),
which is able to adaptively change the size of sampled areas without becoming
snared in locally optimal solutions. 2) A new approach to leverage non-local
reliable points and construct a planar prior model based on K-Nearest Neighbor
(KNN), to obtain potential hypotheses for the regions where prior construction
is challenging. 3) A Hierarchical Prior Mining (HPM) framework, which is used
to mine extensive non-local prior information at different scales to assist 3D
model recovery, this strategy can achieve a considerable balance between the
reconstruction of details and low-textured areas. Experimental results on the
ETH3D and Tanks \& Temples have verified the superior performance and strong
generalization capability of our method. Our code will be released.
- Abstract(参考訳): コンピュータビジョンの基本的な問題として、マルチビューステレオ(MVS)は、ターゲットの3次元形状を一連の2次元画像から復元することを目的としている。
MVSの最近の進歩は、低テクスチャ領域における幾何学の回復のために、非局所構造情報を知覚することが重要であることを示している。
本研究では,非局所マルチビューステレオ(hpm-mvs)の階層的事前マイニングを提案する。
主な特徴は、非ローカル情報を利用したMVS支援技術である。
1)非局所拡張型サンプリングパターン (NESP) は, 局所最適解に精通することなく, サンプル領域のサイズを適応的に変化させることができる。
2)K-Nearest Neighbor(KNN)に基づく非局所信頼点の活用と計画的事前モデルの構築により,事前構築が困難である地域に対する潜在的仮説を得る。
3) 大規模非局所的事前情報を異なるスケールでマイニングして3次元モデル復元を支援する階層的事前マイニング(hpm)フレームワークは,詳細な再構築と低テクスチャ領域とのかなりのバランスを実現することができる。
eth3d とタンク \& temple の実験結果から,本手法の優れた性能と強汎化性能が確認できた。
私たちのコードはリリースされます。
関連論文リスト
- ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - PillarNeXt: Rethinking Network Designs for 3D Object Detection in LiDAR
Point Clouds [29.15589024703907]
本稿では,計算資源の割り当ての観点から,局所的な点集合体を再考する。
最も単純な柱ベースのモデルは、精度とレイテンシの両方を考慮して驚くほどよく機能することがわかった。
本研究は,3次元物体検出の高性能化のために,詳細な幾何学的モデリングが不可欠である,という一般的な直観に挑戦する。
論文 参考訳(メタデータ) (2023-05-08T17:59:14Z) - NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction [64.36535692191343]
暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示しており、オンラインSLAMシステムの可能性も最近示している。
本論文は,1)新しい表現に基づく視点計画の質を評価するための基準を求めること,2)手作りではなく,異なる場面に一般化可能なデータから基準を学習すること,の2つの課題に対処する。
本手法は, TSDFを用いた変形モデルやビュープランニングなしでの再構成モデルと比較した場合, レンダリングされた画像品質と再構成された3次元モデルの幾何学的品質について, 様々な指標について有意な改善を示す。
論文 参考訳(メタデータ) (2022-07-22T10:05:36Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Stereo Neural Vernier Caliper [57.187088191829886]
学習に基づくステレオ3Dオブジェクト検出のための新しいオブジェクト中心フレームワークを提案する。
初期3次元立方体推定値から改良された更新を予測する方法の問題に対処する。
提案手法は,KITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T14:36:07Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。