論文の概要: Learning Pose-invariant 3D Object Reconstruction from Single-view Images
- arxiv url: http://arxiv.org/abs/2004.01347v2
- Date: Mon, 27 Jul 2020 08:11:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 04:39:10.386877
- Title: Learning Pose-invariant 3D Object Reconstruction from Single-view Images
- Title(参考訳): 単一視点画像を用いた3次元物体再構成の学習
- Authors: Bo Peng, Wei Wang, Jing Dong and Tieniu Tan
- Abstract要約: 本稿では,単視点画像のみから3次元形状を学習する,より現実的な構成について検討する。
最大の難しさは、単一のビューイメージが提供できる制約の不足にある。
本稿では, 対角コンパクトな形状空間を学習するために, 効果的な対角領域混同法を提案する。
- 参考スコア(独自算出の注目度): 61.98279201609436
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning to reconstruct 3D shapes using 2D images is an active research
topic, with benefits of not requiring expensive 3D data. However, most work in
this direction requires multi-view images for each object instance as training
supervision, which oftentimes does not apply in practice. In this paper, we
relax the common multi-view assumption and explore a more challenging yet more
realistic setup of learning 3D shape from only single-view images. The major
difficulty lies in insufficient constraints that can be provided by single view
images, which leads to the problem of pose entanglement in learned shape space.
As a result, reconstructed shapes vary along input pose and have poor accuracy.
We address this problem by taking a novel domain adaptation perspective, and
propose an effective adversarial domain confusion method to learn
pose-disentangled compact shape space. Experiments on single-view
reconstruction show effectiveness in solving pose entanglement, and the
proposed method achieves on-par reconstruction accuracy with state-of-the-art
with higher efficiency.
- Abstract(参考訳): 2D画像を用いて3D形状を再構築する学習は、高価な3Dデータを必要とせず、活発な研究課題である。
しかし、この方向のほとんどの作業では、トレーニングの監督として各オブジェクトインスタンスのマルチビューイメージが必要です。
本稿では,多視点の一般的な仮定を緩和し,単視点画像のみから3次元形状を学習するより挑戦的かつ現実的な設定について検討する。
最大の難しさは、単一のビューイメージによって提供できる制約が不十分であることであり、学習された形状空間におけるポーズ絡みの問題につながる。
結果として、再構成された形状は入力ポーズに沿って変化し、精度が劣る。
本稿では,新しい領域適応の視点を採ってこの問題に対処し,対角コンパクトな形状空間を学習するための効果的な対角領域混乱法を提案する。
単視点再構成実験はポーズ絡みの解法の有効性を示し, 提案手法は高い効率で最先端の再現精度を実現する。
関連論文リスト
- EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild [79.71523320368388]
本研究の目的は,手動物体のインタラクションを単一視点画像から再構築することである。
まず、手ポーズとオブジェクト形状を推定する新しいパイプラインを設計する。
最初の再構築では、事前に誘導された最適化方式を採用する。
論文 参考訳(メタデータ) (2024-11-21T16:33:35Z) - MeTTA: Single-View to 3D Textured Mesh Reconstruction with Test-Time Adaptation [19.15982759396811]
本稿では, 生成前のテスト時間適応であるMeTTAを提案する。
3次元形状,外観,ポーズの連成最適化を設計し,OoDのケースを単一のビューイメージで処理する。
MeTTAは、既存の学習ベースの3D再構成モデルの障害ケースにおけるOoDシナリオを効果的に扱う。
論文 参考訳(メタデータ) (2024-08-21T09:35:16Z) - Few-View Object Reconstruction with Unknown Categories and Camera Poses [80.0820650171476]
この研究は、カメラのポーズやオブジェクトのカテゴリを知らない少数の画像から、一般的な現実世界のオブジェクトを再構築する。
私たちの研究の要点は、形状再構成とポーズ推定という、2つの基本的な3D視覚問題を解決することです。
提案手法は,各ビューから3次元特徴を予測し,それらを入力画像と組み合わせて活用し,クロスビュー対応を確立する。
論文 参考訳(メタデータ) (2022-12-08T18:59:02Z) - 3D-Augmented Contrastive Knowledge Distillation for Image-based Object
Pose Estimation [4.415086501328683]
トレーニングプロセスでは3D形状が活用され、テストは依然として純粋に画像ベースである。
マルチモーダルモデルから画像ベースモデルへ3次元拡張画像表現を効果的に転送する新しいコントラスト型知識蒸留フレームワークを提案する。
我々は,既存のカテゴリに依存しない画像ベース手法と比較して,最先端の成果を大きなマージンで報告した。
論文 参考訳(メタデータ) (2022-06-02T16:46:18Z) - Unsupervised Severely Deformed Mesh Reconstruction (DMR) from a
Single-View Image [26.464091507125826]
単視点画像から3次元形状を推定するテンプレートベースの手法を導入し、再構成メッシュを下流タスクに適用する。
本手法は3次元メッシュを忠実に再構築し,魚の群集長計測における最先端の精度を実現する。
論文 参考訳(メタデータ) (2022-01-23T21:46:30Z) - Toward Realistic Single-View 3D Object Reconstruction with Unsupervised
Learning from Multiple Images [18.888384816156744]
マルチイメージデータセットから3次元再構成ネットワークを学習するための新しい教師なしアルゴリズムを提案する。
我々のアルゴリズムはより一般的であり、特別の場合として対称性が要求されるシナリオをカバーしている。
我々の手法は、品質と堅牢性の両方において、これまでの仕事を上回っている。
論文 参考訳(メタデータ) (2021-09-06T08:34:04Z) - Discovering 3D Parts from Image Collections [98.16987919686709]
本稿では,2次元画像収集のみによる3次元部分発見の問題に対処する。
そこで我々は,手動で注釈付部品を監督する代わりに,自己監督型アプローチを提案する。
私たちのキーとなる洞察は、前もって新しい部分の形状を学習することで、各部分は、単純な幾何学を持つように制約されたまま、忠実にオブジェクトの形状に適合できるようにします。
論文 参考訳(メタデータ) (2021-07-28T20:29:16Z) - 3D Human Shape and Pose from a Single Low-Resolution Image with
Self-Supervised Learning [105.49950571267715]
3次元人物形状とポーズ推定のための既存のディープラーニング手法は、比較的高解像度な入力画像に依存している。
本稿では,レゾリューション・アウェア・ネットワーク,セルフ・スーパービジョン・ロス,コントラッシブ・ラーニング・スキームからなるRCC-Netを提案する。
これら2つの新たなトレーニング損失は,3次元形状を学習し,弱教師ありの姿勢を示す。
論文 参考訳(メタデータ) (2020-07-27T16:19:52Z) - From Image Collections to Point Clouds with Self-supervised Shape and
Pose Networks [53.71440550507745]
2次元画像から3Dモデルを再構成することは、コンピュータビジョンの基本的な問題の一つである。
本研究では,1枚の画像から3次元オブジェクトを再構成する深層学習手法を提案する。
我々は,3次元点雲の再構成と推定ネットワークの自己教師方式の両方を学習する。
論文 参考訳(メタデータ) (2020-05-05T04:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。