論文の概要: Black-Box Test-Time Shape REFINEment for Single View 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2108.09911v1
- Date: Mon, 23 Aug 2021 03:28:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 23:13:57.308092
- Title: Black-Box Test-Time Shape REFINEment for Single View 3D Reconstruction
- Title(参考訳): シングルビュー3次元再構成のためのブラックボックス試験時間形状改善
- Authors: Brandon Leung, Chih-Hui Ho, Nuno Vasconcelos
- Abstract要約: 文献中の任意のブラックボックス方式のパイプラインに容易に組み込むことができる後処理メッシュ改善ステップであるREFINEを提案する。
テスト時には、REFINEはメッシュ毎のネットワークインスタンスを最適化し、メッシュと所定のオブジェクトビュー間の一貫性を促進する。
- 参考スコア(独自算出の注目度): 57.805334118057665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Much recent progress has been made in reconstructing the 3D shape of an
object from an image of it, i.e. single view 3D reconstruction. However, it has
been suggested that current methods simply adopt a "nearest-neighbor" strategy,
instead of genuinely understanding the shape behind the input image. In this
paper, we rigorously show that for many state of the art methods, this issue
manifests as (1) inconsistencies between coarse reconstructions and input
images, and (2) inability to generalize across domains. We thus propose REFINE,
a postprocessing mesh refinement step that can be easily integrated into the
pipeline of any black-box method in the literature. At test time, REFINE
optimizes a network per mesh instance, to encourage consistency between the
mesh and the given object view. This, along with a novel combination of
regularizing losses, reduces the domain gap and achieves state of the art
performance. We believe that this novel paradigm is an important step towards
robust, accurate reconstructions, remaining relevant as new reconstruction
networks are introduced.
- Abstract(参考訳): 画像から物体の3次元形状、すなわち物体の3次元形状を復元する手法が近年進歩している。
シングルビュー3D再構築。
しかし,現在の手法では,入力画像の形状を真に理解するのではなく,単に「アレスト近傍」戦略を採用することが示唆されている。
本稿では,(1)粗い再構成と入力画像との矛盾,(2)ドメインをまたがる一般化ができないこと,等を厳格に示す。
そこで本研究では,黒箱法のパイプラインに容易に統合可能な後処理メッシュ改良ステップであるrefineを提案する。
テスト時には、REFINEはメッシュ毎のネットワークインスタンスを最適化し、メッシュと所定のオブジェクトビュー間の一貫性を促進する。
これは損失の正規化という新たな組み合わせと共に、ドメインギャップを減らし、アートパフォーマンスの状態を達成します。
我々は、この新パラダイムが、新しい再建ネットワークの導入に伴って、堅牢で正確な再構築に向けた重要なステップであると信じている。
関連論文リスト
- 3D Mesh Editing using Masked LRMs [26.34216998140891]
マルチビュー画像からの3次元再構成の最近の進歩を基盤として,メッシュ形状の編集に新たなアプローチを提案する。
モデルでは, 所定の3次元領域を除いて, 入力形状を再構成しなければならない条件付き再構成問題として形状編集を定式化する。
提案手法は,1つのフォワードパスでSoTAと同等の再構成機能によって,非マスキーク領域の入力幾何を保存できるだけでなく,単一の画像ガイダンスから様々なメッシュ編集を行うのに十分であることを示す。
論文 参考訳(メタデータ) (2024-12-11T18:59:17Z) - 2L3: Lifting Imperfect Generated 2D Images into Accurate 3D [16.66666619143761]
マルチビュー(MV)3次元再構成は,生成したMV画像を一貫した3次元オブジェクトに融合させる,有望なソリューションである。
しかし、生成された画像は、通常、一貫性のない照明、不整合幾何学、スパースビューに悩まされ、復元の質が低下する。
本稿では, 内在的分解誘導, 過渡的モノ先行誘導, および3つの問題に対処するための視認性向上を活用する新しい3次元再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-29T02:30:31Z) - SADIR: Shape-Aware Diffusion Models for 3D Image Reconstruction [2.2954246824369218]
限られた2次元画像からの3次元画像再構成は、コンピュータビジョンと画像解析における長年にわたる課題である。
本研究では,これらの問題に対処する3次元画像再構成のための拡散モデルに基づく形状認識ネットワークSADIRを提案する。
論文 参考訳(メタデータ) (2023-09-06T19:30:22Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Shape from Blur: Recovering Textured 3D Shape and Motion of Fast Moving
Objects [115.71874459429381]
本研究では, 物体の3次元形状, テクスチャ, 動きを単一動画像から共同で再構成する新しい課題について述べる。
従来の手法では2次元画像領域でのみ遅延問題に対処するが、3次元領域における全ての物体特性の厳密なモデリングは任意の物体の動きの正確な記述を可能にする。
論文 参考訳(メタデータ) (2021-06-16T13:18:08Z) - From Points to Multi-Object 3D Reconstruction [71.17445805257196]
単一のRGB画像から複数の3Dオブジェクトを検出し再構成する方法を提案する。
キーポイント検出器は、オブジェクトを中心点としてローカライズし、9-DoF境界ボックスや3D形状を含む全てのオブジェクト特性を直接予測する。
提示されたアプローチは、軽量な再構築を単一ステージで実行し、リアルタイム能力を持ち、完全に微分可能で、エンドツーエンドのトレーナーブルである。
論文 参考訳(メタデータ) (2020-12-21T18:52:21Z) - SparseFusion: Dynamic Human Avatar Modeling from Sparse RGBD Images [49.52782544649703]
本稿では,RGBDフレームのスパース集合に基づく3次元人体形状の再構築手法を提案する。
主な課題は、これらのスパースフレームを標準的な3Dモデルにしっかりと融合させる方法だ。
私たちのフレームワークは柔軟で、潜在的なアプリケーションは形状の再構築を超えています。
論文 参考訳(メタデータ) (2020-06-05T18:53:36Z) - Reconstruct, Rasterize and Backprop: Dense shape and pose estimation
from a single image [14.9851111159799]
本稿では,1枚の画像から6-DoFポーズとともに高密度物体再構成を行うシステムを提案する。
我々は、カメラフレームの3D再構成でループを閉じるために、差別化可能なレンダリング(特にロボティクス)の最近の進歩を活用している。
論文 参考訳(メタデータ) (2020-04-25T20:53:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。