論文の概要: Few-shot Single-view 3D Reconstruction with Memory Prior Contrastive
Network
- arxiv url: http://arxiv.org/abs/2208.00183v1
- Date: Sat, 30 Jul 2022 10:49:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:40:22.962069
- Title: Few-shot Single-view 3D Reconstruction with Memory Prior Contrastive
Network
- Title(参考訳): メモリ優先型コントラストネットワークを用いたマイズショット・シングルビュー3次元再構成
- Authors: Zhen Xing and Yijiang Chen and Zhixin Ling and Xiangdong Zhou and Yu
Xiang
- Abstract要約: 数ショット学習に基づく新しいカテゴリーの3次元再構成が現実の応用にアピールしている。
本稿では,記憶優先コントラストネットワーク (MPCN) を提案する。
- 参考スコア(独自算出の注目度): 18.000566656946475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D reconstruction of novel categories based on few-shot learning is appealing
in real-world applications and attracts increasing research interests. Previous
approaches mainly focus on how to design shape prior models for different
categories. Their performance on unseen categories is not very competitive. In
this paper, we present a Memory Prior Contrastive Network (MPCN) that can store
shape prior knowledge in a few-shot learning based 3D reconstruction framework.
With the shape memory, a multi-head attention module is proposed to capture
different parts of a candidate shape prior and fuse these parts together to
guide 3D reconstruction of novel categories. Besides, we introduce a 3D-aware
contrastive learning method, which can not only complement the retrieval
accuracy of memory network, but also better organize image features for
downstream tasks. Compared with previous few-shot 3D reconstruction methods,
MPCN can handle the inter-class variability without category annotations.
Experimental results on a benchmark synthetic dataset and the Pascal3D+
real-world dataset show that our model outperforms the current state-of-the-art
methods significantly.
- Abstract(参考訳): 数ショット学習に基づく新しいカテゴリーの3次元再構築は、現実の応用にアピールし、研究の関心が高まりつつある。
従来のアプローチは主に、さまざまなカテゴリの事前モデルを設計する方法に重点を置いている。
目立たないカテゴリでの彼らのパフォーマンスは、あまり競争力がない。
本稿では,3次元学習に基づく3次元再構築フレームワークにおいて,形状事前知識を記憶できるメモリ先行コントラストネットワーク(mpcn)を提案する。
形状記憶では, 候補形状の異なる部分を予めキャプチャし, それらの部品を融合して, 新たなカテゴリの3次元再構築を導くマルチヘッドアテンションモジュールが提案されている。
また,メモリネットワークの検索精度を補完するだけでなく,下流タスクにおける画像特徴の整理も行う3次元認識型コントラスト学習手法を提案する。
従来の数発の3D再構成手法と比較して、MPCNはカテゴリアノテーションなしでクラス間変動を処理できる。
ベンチマーク合成データセットとPascal3D+実世界のデータセットによる実験結果から,我々のモデルは最先端の手法よりも優れていた。
関連論文リスト
- Split-and-Fit: Learning B-Reps via Structure-Aware Voronoi Partitioning [50.684254969269546]
本稿では,3次元CADモデルのバウンダリ表現(B-Reps)を取得する新しい手法を提案する。
各パーティション内に1つのプリミティブを導出するために空間分割を適用する。
我々のネットワークはニューラルなボロノイ図でNVD-Netと呼ばれ、訓練データからCADモデルのボロノイ分割を効果的に学習できることを示す。
論文 参考訳(メタデータ) (2024-06-07T21:07:49Z) - Part123: Part-aware 3D Reconstruction from a Single-view Image [54.589723979757515]
Part123は、一視点画像から部分認識された3D再構成のための新しいフレームワークである。
ニューラルレンダリングフレームワークにコントラスト学習を導入し、部分認識機能空間を学習する。
クラスタリングに基づくアルゴリズムも開発され、再構成されたモデルから3次元部分分割結果を自動的に導出する。
論文 参考訳(メタデータ) (2024-05-27T07:10:21Z) - A Fusion of Variational Distribution Priors and Saliency Map Replay for
Continual 3D Reconstruction [1.3812010983144802]
単一画像からの3次元物体形状の予測に焦点をあてた研究課題である。
このタスクは、形状の可視部分と隠蔽部分の両方を予測するために、重要なデータ取得を必要とする。
本稿では,従来のクラスを新しいクラスで学習した後でも合理的に再構築できる変分優先を用いたモデルの設計を目標とする,連続的な学習に基づく3D再構成手法を提案する。
論文 参考訳(メタデータ) (2023-08-17T06:48:55Z) - Semi-Supervised Single-View 3D Reconstruction via Prototype Shape Priors [79.80916315953374]
本研究では,3次元再構成のための半教師付きフレームワークであるSSP3Dを提案する。
本稿では,現実的なオブジェクト再構成を導くために,注意誘導型プロトタイプ形状先行モジュールを提案する。
実世界のPix3Dデータセットに10%のラベリング比で転送する場合も,本手法は良好に機能する。
論文 参考訳(メタデータ) (2022-09-30T11:19:25Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Pre-train, Self-train, Distill: A simple recipe for Supersizing 3D
Reconstruction [47.38670633513938]
我々は、数百のセマンティックカテゴリからオブジェクトの単一ビュー3D再構成のための統一モデルを学ぶ。
我々の研究は、一般的なカテゴリの3D学習のための分割画像収集に依存している。
論文 参考訳(メタデータ) (2022-04-07T17:59:25Z) - Learning Compositional Shape Priors for Few-Shot 3D Reconstruction [36.40776735291117]
複雑なエンコーダ・デコーダアーキテクチャが,カテゴリごとの大量のデータを利用することを示す。
データから直接クラス固有のグローバルな形状を学習する3つの方法を提案する。
人気のShapeNetデータセットの実験から,本手法はゼロショットベースラインを40%以上上回る性能を示した。
論文 参考訳(メタデータ) (2021-06-11T14:55:49Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Few-Shot Single-View 3-D Object Reconstruction with Compositional Priors [30.262308825799167]
複雑なエンコーダ・デコーダアーキテクチャは、標準ベンチマークにおいて、最寄りのベースラインと同様に動作することを示す。
本稿では,3次元再構成モデルに事前クラスを効率的に統合する3つの手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T04:53:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。