論文の概要: Deep NRSfM++: Towards Unsupervised 2D-3D Lifting in the Wild
- arxiv url: http://arxiv.org/abs/2001.10090v2
- Date: Wed, 31 Mar 2021 02:18:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 08:25:33.047432
- Title: Deep NRSfM++: Towards Unsupervised 2D-3D Lifting in the Wild
- Title(参考訳): Deep NRSfM++: 野生での教師なし2D-3Dリフティングを目指して
- Authors: Chaoyang Wang and Chen-Hsuan Lin and Simon Lucey
- Abstract要約: 上記の課題に対処するために,学習に基づくNRSfM法を改善するための戦略を提案する。
当社のアプローチであるDeep NRSfM++は、多数の大規模ベンチマークで最先端のパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 44.78174845839193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recovery of 3D shape and pose from 2D landmarks stemming from a large
ensemble of images can be viewed as a non-rigid structure from motion (NRSfM)
problem. Classical NRSfM approaches, however, are problematic as they rely on
heuristic priors on the 3D structure (e.g. low rank) that do not scale well to
large datasets. Learning-based methods are showing the potential to reconstruct
a much broader set of 3D structures than classical methods -- dramatically
expanding the importance of NRSfM to atemporal unsupervised 2D to 3D lifting.
Hitherto, these learning approaches have not been able to effectively model
perspective cameras or handle missing/occluded points -- limiting their
applicability to in-the-wild datasets. In this paper, we present a generalized
strategy for improving learning-based NRSfM methods to tackle the above issues.
Our approach, Deep NRSfM++, achieves state-of-the-art performance across
numerous large-scale benchmarks, outperforming both classical and
learning-based 2D-3D lifting methods.
- Abstract(参考訳): 画像の大きなアンサンブルから生じる2次元ランドマークからの3次元形状とポーズの復元は、モーション(NRSfM)問題からの非剛体構造と見なすことができる。
しかし、古典的なNRSfMアプローチは、大規模なデータセットにうまくスケールしない3D構造(例えば低ランク)にヒューリスティックな先行性に依存するため、問題となる。
学習ベースの手法は、古典的手法よりもずっと広い3d構造のセットを再構築する可能性を示しています。nrsfmの重要性を、教師なしの2dから3dリフティングへと劇的に拡大しています。これらの学習アプローチは、遠近法カメラを効果的にモデル化したり、欠落点や目立たない点を扱ったりすることはできず、wildデータセットへの適用性を制限することができます。
本稿では,これらの課題に対処するために,学習に基づくNRSfM法を改善するための一般化戦略を提案する。
我々のアプローチであるDeep NRSfM++は、多数の大規模ベンチマークで最先端のパフォーマンスを実現し、古典的および学習ベースの2D-3Dリフト法よりも優れています。
関連論文リスト
- FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - 3D-LFM: Lifting Foundation Model [29.48835001900286]
ディープラーニングは、幅広いオブジェクトクラスを再構築する能力を拡大しました。
提案手法は, 3次元データインスタンス毎に異なる数点を管理するために, 固有置換同値変換器を利用する。
本稿では,2D-3Dリフトタスクベンチマークにおけるアートパフォーマンスについて述べる。
論文 参考訳(メタデータ) (2023-12-19T06:38:18Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - Weakly-supervised Pre-training for 3D Human Pose Estimation via
Perspective Knowledge [36.65402869749077]
本研究では,3次元ポーズを監督せずに2次元画像から直接弱い3次元情報を抽出する手法を提案する。
画像中の2点間の深度関係を識別するために,弱教師付き事前学習(WSP)戦略を提案する。
WSPは2つの広く使用されているベンチマークで最先端の結果を達成する。
論文 参考訳(メタデータ) (2022-11-22T03:35:15Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - Procrustean Regression Networks: Learning 3D Structure of Non-Rigid
Objects from 2D Annotations [42.476537776831314]
非剛体物体の3次元情報を学習できるニューラルネットワークの学習フレームワークを提案する。
提案手法は,Human 3.6M,300-VW,SURREALデータセット上での最先端手法よりも優れた再構成性能を示す。
論文 参考訳(メタデータ) (2020-07-21T17:29:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。