論文の概要: GaussiGAN: Controllable Image Synthesis with 3D Gaussians from Unposed
Silhouettes
- arxiv url: http://arxiv.org/abs/2106.13215v1
- Date: Thu, 24 Jun 2021 17:47:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 17:10:28.736647
- Title: GaussiGAN: Controllable Image Synthesis with 3D Gaussians from Unposed
Silhouettes
- Title(参考訳): gaussigan: 3次元gaussianによる制御可能な画像合成
- Authors: Youssef A.Mejjati and Isa Milefchik and Aaron Gokaslan and Oliver Wang
and Kwang In Kim and James Tompkin
- Abstract要約: 対象物の粗い3次元表現を多視点2次元マスク監視から学習するアルゴリズムを提案する。
既存のボクセルを用いた物体再構成法とは対照的に,提案手法は生成した形状やポーズを表現することを学ぶ。
リアル照明を用いた合成データセットの結果を示し、対話的なポーズによるオブジェクト挿入を実証する。
- 参考スコア(独自算出の注目度): 48.642181362172906
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an algorithm that learns a coarse 3D representation of objects
from unposed multi-view 2D mask supervision, then uses it to generate detailed
mask and image texture. In contrast to existing voxel-based methods for unposed
object reconstruction, our approach learns to represent the generated shape and
pose with a set of self-supervised canonical 3D anisotropic Gaussians via a
perspective camera, and a set of per-image transforms. We show that this
approach can robustly estimate a 3D space for the camera and object, while
recent baselines sometimes struggle to reconstruct coherent 3D spaces in this
setting. We show results on synthetic datasets with realistic lighting, and
demonstrate object insertion with interactive posing. With our work, we help
move towards structured representations that handle more real-world variation
in learning-based object reconstruction.
- Abstract(参考訳): 本研究では,複数視点の2次元マスクの監視から物体の粗い3次元表現を学習し,それを用いて詳細なマスクとテクスチャを生成するアルゴリズムを提案する。
既存のボクセルを用いた物体再構成法とは対照的に,本手法は生成した形状を表現し,視点カメラによる自己監督型正準3次元異方性ガウス像と画像毎の変換を用いてポーズする。
この手法はカメラとオブジェクトの3d空間をロバストに推定できるが、最近のベースラインはこの設定でコヒーレントな3d空間を再構築するのに苦労することがある。
リアル照明を用いた合成データセットの結果を示し、対話的なポーズによるオブジェクト挿入を示す。
私たちの研究は、学習に基づくオブジェクト再構成において、より現実的なバリエーションを扱う構造化表現への移行を支援する。
関連論文リスト
- 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - Style Agnostic 3D Reconstruction via Adversarial Style Transfer [23.304453155586312]
物体の3次元形状を画像から再構成することは、コンピュータビジョンにおける大きな課題である。
本研究では,背景を持つ画像から3次元物体を識別可能な学習法を提案する。
論文 参考訳(メタデータ) (2021-10-20T21:24:44Z) - DensePose 3D: Lifting Canonical Surface Maps of Articulated Objects to
the Third Dimension [71.71234436165255]
DensePose 3Dは2次元画像アノテーションのみから弱い教師付きで再構築を学習できる手法である。
3Dスキャンを必要としないため、DensePose 3Dは異なる動物種などの幅広いカテゴリーの学習に利用できる。
我々は,人間と動物のカテゴリーの合成データと実データの両方をベースラインとして,最先端の非剛体構造と比較し,顕著な改善を示した。
論文 参考訳(メタデータ) (2021-08-31T18:33:55Z) - Learning Canonical 3D Object Representation for Fine-Grained Recognition [77.33501114409036]
本研究では,1枚の画像から3次元空間における物体の変動を再現する微粒な物体認識のための新しいフレームワークを提案する。
我々は,物体を3次元形状とその外観の合成として表現し,カメラ視点の影響を排除した。
深部表現に3次元形状と外観を併用することにより,物体の識別表現を学習する。
論文 参考訳(メタデータ) (2021-08-10T12:19:34Z) - Sparse Pose Trajectory Completion [87.31270669154452]
サンプルの少ないビューにのみオブジェクトが出現するデータセットを使用しても学習する方法を提案する。
これはクロスモーダルポーズ軌道伝達機構によって実現される。
この手法はPix3DおよびShapeNetデータセット上で評価される。
論文 参考訳(メタデータ) (2021-05-01T00:07:21Z) - Fully Understanding Generic Objects: Modeling, Segmentation, and
Reconstruction [33.95791350070165]
2D画像からジェネリックオブジェクトの3D構造を推定することは、コンピュータビジョンの長年の目標です。
半教師付き学習による代替アプローチを取る。
つまり、ジェネリックオブジェクトの2Dイメージでは、カテゴリ、形状、およびアルベドの潜在的な表現に分解します。
完全な形状とアルベドモデリングにより、モデリングとモデルフィッティングの両方で実際の2Dイメージを活用できることを示しています。
論文 参考訳(メタデータ) (2021-04-02T02:39:29Z) - Weakly Supervised Learning of Multi-Object 3D Scene Decompositions Using
Deep Shape Priors [69.02332607843569]
PriSMONetは、単一画像から多目的3Dシーンの分解と表現を学習するための新しいアプローチである。
リカレントエンコーダは、入力されたRGB画像から、各オブジェクトの3D形状、ポーズ、テクスチャの潜時表現を回帰する。
我々は,3次元シーンレイアウトの推測におけるモデルの精度を評価し,その生成能力を実証し,実画像への一般化を評価し,学習した表現の利点を指摘する。
論文 参考訳(メタデータ) (2020-10-08T14:49:23Z) - Towards Realistic 3D Embedding via View Alignment [53.89445873577063]
本稿では,3次元モデルを2次元背景画像に現実的に,かつ自動的に埋め込み,新たな画像を構成する,革新的なビューアライメントGAN(VA-GAN)を提案する。
VA-GANはテクスチャジェネレータとディファレンシャルディスクリミネーターで構成され、相互接続され、エンドツーエンドのトレーニングが可能である。
論文 参考訳(メタデータ) (2020-07-14T14:45:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。