論文の概要: 3DMiner: Discovering Shapes from Large-Scale Unannotated Image Datasets
- arxiv url: http://arxiv.org/abs/2310.19188v1
- Date: Sun, 29 Oct 2023 23:08:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 13:45:02.708540
- Title: 3DMiner: Discovering Shapes from Large-Scale Unannotated Image Datasets
- Title(参考訳): 3dminer: 大規模無注釈画像データセットから形状を検出する
- Authors: Ta-Ying Cheng, Matheus Gadelha, Soren Pirk, Thibault Groueix, Radomir
Mech, Andrew Markham, Niki Trigoni
- Abstract要約: 3DMinerは、挑戦的なデータセットから3D形状をマイニングするためのパイプラインである。
本手法は最先端の教師なし3次元再構成技術よりもはるかに優れた結果が得られる。
LAION-5Bデータセットから得られる画像の形状を再構成することにより,3DMinerを組込みデータに適用する方法を示す。
- 参考スコア(独自算出の注目度): 34.610546020800236
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present 3DMiner -- a pipeline for mining 3D shapes from challenging
large-scale unannotated image datasets. Unlike other unsupervised 3D
reconstruction methods, we assume that, within a large-enough dataset, there
must exist images of objects with similar shapes but varying backgrounds,
textures, and viewpoints. Our approach leverages the recent advances in
learning self-supervised image representations to cluster images with
geometrically similar shapes and find common image correspondences between
them. We then exploit these correspondences to obtain rough camera estimates as
initialization for bundle-adjustment. Finally, for every image cluster, we
apply a progressive bundle-adjusting reconstruction method to learn a neural
occupancy field representing the underlying shape. We show that this procedure
is robust to several types of errors introduced in previous steps (e.g., wrong
camera poses, images containing dissimilar shapes, etc.), allowing us to obtain
shape and pose annotations for images in-the-wild. When using images from Pix3D
chairs, our method is capable of producing significantly better results than
state-of-the-art unsupervised 3D reconstruction techniques, both quantitatively
and qualitatively. Furthermore, we show how 3DMiner can be applied to
in-the-wild data by reconstructing shapes present in images from the LAION-5B
dataset. Project Page: https://ttchengab.github.io/3dminerOfficial
- Abstract(参考訳): 3dminer - 大規模な注釈なしの画像データセットから3d形状をマイニングするパイプラインです。
他の教師なしの3次元再構成手法とは異なり、大容量のデータセットには、類似した形状の物体の画像が存在するが、背景、テクスチャ、視点は様々である。
提案手法は,幾何学的に類似した形状のクラスタ画像に自己教師付き画像表現を学習し,それらの間の共通画像対応を見出す手法である。
次に、これらの対応を利用して、バンドル調整の初期化として粗いカメラ推定値を得る。
最後に,各画像クラスタにプログレッシブバンドル調整再構成を適用し,その基礎となる形状を表す神経占有場を学習する。
この手順は、前段で導入された複数のタイプの誤り(例えば、間違ったカメラポーズ、異なる形状を含む画像など)に頑健であることを示し、画像の形状やポーズアノテーションをそのまま得ることができることを示した。
Pix3Dチェアからの画像を使用する場合,従来の非教師なし3D再構成技術よりも定量的かつ定性的に,はるかに優れた結果が得られる。
さらに,LAION-5Bデータセットから得られる画像の形状を再構成することにより,3DMinerを組込みデータに適用する方法を示す。
プロジェクトページ: https://ttchengab.github.io/3dminerofficial
関連論文リスト
- SADIR: Shape-Aware Diffusion Models for 3D Image Reconstruction [2.2954246824369218]
限られた2次元画像からの3次元画像再構成は、コンピュータビジョンと画像解析における長年にわたる課題である。
本研究では,これらの問題に対処する3次元画像再構成のための拡散モデルに基づく形状認識ネットワークSADIRを提案する。
論文 参考訳(メタデータ) (2023-09-06T19:30:22Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Beyond 3DMM: Learning to Capture High-fidelity 3D Face Shape [77.95154911528365]
3Dモーフィブルモデル(3DMM)の適合性は、その強力な3D先行性のため、顔解析に広く有用である。
以前に再建された3次元顔は、微細な形状が失われるため、視差の低下に悩まされていた。
本論文は, パーソナライズされた形状が対応する人物と同一に見えるよう, パーソナライズされた形状を捉えるための完全な解を提案する。
論文 参考訳(メタデータ) (2022-04-09T03:46:18Z) - 3D Shape Reconstruction from 2D Images with Disentangled Attribute Flow [61.62796058294777]
単一の2D画像から3D形状を再構築することは難しい作業だ。
従来の手法の多くは3次元再構成作業における意味的属性の抽出に苦慮している。
本稿では,3DAttriFlowを用いて,入力画像の異なる意味レベルから意味的属性を抽出する手法を提案する。
論文 参考訳(メタデータ) (2022-03-29T02:03:31Z) - Learnable Triangulation for Deep Learning-based 3D Reconstruction of
Objects of Arbitrary Topology from Single RGB Images [12.693545159861857]
モノクロ画像から3次元物体を再構成する深層強化学習手法を提案する。
提案手法は, 視覚的品質, 再構成精度, 計算時間において, 最先端技術よりも優れる。
論文 参考訳(メタデータ) (2021-09-24T09:44:22Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - Self-Supervised 2D Image to 3D Shape Translation with Disentangled
Representations [92.89846887298852]
本稿では,2次元画像ビューと3次元オブジェクト形状を翻訳するフレームワークを提案する。
形状変換のための自己教師型画像変換フレームワークであるSISTを提案する。
論文 参考訳(メタデータ) (2020-03-22T22:44:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。