論文の概要: Pre-train, Self-train, Distill: A simple recipe for Supersizing 3D
Reconstruction
- arxiv url: http://arxiv.org/abs/2204.03642v1
- Date: Thu, 7 Apr 2022 17:59:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-08 15:00:48.722750
- Title: Pre-train, Self-train, Distill: A simple recipe for Supersizing 3D
Reconstruction
- Title(参考訳): プレトレイン, セルフトレイン, 蒸留 : 簡易な3次元再構成法
- Authors: Kalyan Vasudev Alwala, Abhinav Gupta, Shubham Tulsiani
- Abstract要約: 我々は、数百のセマンティックカテゴリからオブジェクトの単一ビュー3D再構成のための統一モデルを学ぶ。
我々の研究は、一般的なカテゴリの3D学習のための分割画像収集に依存している。
- 参考スコア(独自算出の注目度): 47.38670633513938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our work learns a unified model for single-view 3D reconstruction of objects
from hundreds of semantic categories. As a scalable alternative to direct 3D
supervision, our work relies on segmented image collections for learning 3D of
generic categories. Unlike prior works that use similar supervision but learn
independent category-specific models from scratch, our approach of learning a
unified model simplifies the training process while also allowing the model to
benefit from the common structure across categories. Using image collections
from standard recognition datasets, we show that our approach allows learning
3D inference for over 150 object categories. We evaluate using two datasets and
qualitatively and quantitatively show that our unified reconstruction approach
improves over prior category-specific reconstruction baselines. Our final 3D
reconstruction model is also capable of zero-shot inference on images from
unseen object categories and we empirically show that increasing the number of
training categories improves the reconstruction quality.
- Abstract(参考訳): 我々の研究は、数百のセマンティックカテゴリからオブジェクトの単一ビュー3D再構成のための統一モデルを学ぶ。
直接3D監視に代わるスケーラブルな代替手段として、一般的なカテゴリの3D学習のための分割画像収集に頼っている。
同様の監督を使いながら、スクラッチから独立したカテゴリ特化モデルを学習する以前の作業とは異なり、統一されたモデルを学ぶという私たちのアプローチは、トレーニングプロセスを単純化するとともに、カテゴリ間の共通構造からモデルのメリットを享受します。
標準認識データセットからの画像収集を用いて,150以上の対象カテゴリの3D推論を学習できることを示す。
2つのデータセットを質的・定量的に評価し,従来のカテゴリ固有の再構築ベースラインよりも統一的再構築アプローチが優れていることを示す。
最終3次元復元モデルは,被写体カテゴリの画像のゼロショット推定も可能であり,訓練カテゴリの増加が復元品質を向上させることを実証的に示す。
関連論文リスト
- Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Few-shot Single-view 3D Reconstruction with Memory Prior Contrastive
Network [18.000566656946475]
数ショット学習に基づく新しいカテゴリーの3次元再構成が現実の応用にアピールしている。
本稿では,記憶優先コントラストネットワーク (MPCN) を提案する。
論文 参考訳(メタデータ) (2022-07-30T10:49:39Z) - Share With Thy Neighbors: Single-View Reconstruction by Cross-Instance
Consistency [59.427074701985795]
単一ビューの再構築は通常、視点アノテーション、シルエット、背景の欠如、同じインスタンスの複数のビュー、テンプレートの形状、対称性に依存する。
異なるオブジェクトインスタンスのイメージ間の一貫性を明確に活用することで、これらの監督と仮説をすべて回避します。
i)プログレッシブ・コンディショニング(プログレッシブ・コンディショニング)、(ii)類似の形状やテクスチャを持つインスタンス間の一貫性の喪失、(ii)モデルのカテゴリからインスタンスへと徐々に専門化するためのトレーニング戦略。
論文 参考訳(メタデータ) (2022-04-21T17:47:35Z) - Multi-Category Mesh Reconstruction From Image Collections [90.24365811344987]
本稿では, 一連の変形可能な3次元モデルとインスタンス固有の変形, ポーズ, テクスチャのセットを組み合わせた, オブジェクトのテクスチャメッシュを推定する手法を提案する。
本手法は,前景マスクと粗いカメラポーズのみを監督として,複数の対象カテゴリの画像を用いて訓練する。
実験により,提案フレームワークは異なる対象カテゴリを区別し,教師なしの方法でカテゴリ固有の形状を学習できることが示唆された。
論文 参考訳(メタデータ) (2021-10-21T16:32:31Z) - StrobeNet: Category-Level Multiview Reconstruction of Articulated
Objects [17.698319441265223]
StrobeNetは、未提示のRGB画像から明瞭なオブジェクトをカテゴリレベルの3D再構成する手法である。
私たちのアプローチは、大きなベースラインを持つ画像で異なる表現で観察された場合でも、オブジェクトを再構築します。
論文 参考訳(メタデータ) (2021-05-17T17:05:42Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - On the generalization of learning-based 3D reconstruction [10.516860541554632]
学習に基づく3次元再構成手法の一般化に影響を及ぼすモデルアーキテクチャで符号化された帰納バイアスについて検討する。
3つの帰納バイアスは,エンコーダの空間的範囲,シーンの基本的な形状を用いて点特徴を記述し,複数のビューから情報を集約する機構,といった性能に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2020-06-27T18:53:41Z) - Few-Shot Single-View 3-D Object Reconstruction with Compositional Priors [30.262308825799167]
複雑なエンコーダ・デコーダアーキテクチャは、標準ベンチマークにおいて、最寄りのベースラインと同様に動作することを示す。
本稿では,3次元再構成モデルに事前クラスを効率的に統合する3つの手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T04:53:34Z) - Self-supervised Single-view 3D Reconstruction via Semantic Consistency [142.71430568330172]
対象物の形状, テクスチャ, カメラポーズを予測できる, 自己監督型, 単視点3D再構成モデルを学習する。
提案手法では,手動で注釈付けしたキーポイント,オブジェクトのマルチビューイメージ,あるいは事前の3Dテンプレートなど,3Dの監督を必要としない。
論文 参考訳(メタデータ) (2020-03-13T20:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。