論文の概要: HM3D-ABO: A Photo-realistic Dataset for Object-centric Multi-view 3D
Reconstruction
- arxiv url: http://arxiv.org/abs/2206.12356v1
- Date: Fri, 24 Jun 2022 16:02:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-27 13:59:03.843390
- Title: HM3D-ABO: A Photo-realistic Dataset for Object-centric Multi-view 3D
Reconstruction
- Title(参考訳): HM3D-ABO:オブジェクト中心多視点3D再構成のためのフォトリアリスティックデータセット
- Authors: Zhenpei Yang, Zaiwei Zhang, Qixing Huang
- Abstract要約: 本稿では、フォトリアリスティックなオブジェクト中心データセットHM3D-ABOを提案する。
リアルな屋内シーンとリアルなオブジェクトを構成することで構築される。
このデータセットは、カメラポーズ推定やノベルビュー合成といったタスクにも有用である。
- 参考スコア(独自算出の注目度): 37.29140654256627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing 3D objects is an important computer vision task that has wide
application in AR/VR. Deep learning algorithm developed for this task usually
relies on an unrealistic synthetic dataset, such as ShapeNet and Things3D. On
the other hand, existing real-captured object-centric datasets usually do not
have enough annotation to enable supervised training or reliable evaluation. In
this technical report, we present a photo-realistic object-centric dataset
HM3D-ABO. It is constructed by composing realistic indoor scene and realistic
object. For each configuration, we provide multi-view RGB observations, a
water-tight mesh model for the object, ground truth depth map and object mask.
The proposed dataset could also be useful for tasks such as camera pose
estimation and novel-view synthesis. The dataset generation code is released at
https://github.com/zhenpeiyang/HM3D-ABO.
- Abstract(参考訳): 3Dオブジェクトの再構築は、AR/VRに幅広い応用をもたらす重要なコンピュータビジョンタスクである。
このタスクのために開発されたディープラーニングアルゴリズムは通常、ShapeNetや Things3Dのような非現実的な合成データセットに依存している。
一方、既存のオブジェクト中心のデータセットは、教師付きトレーニングや信頼性評価を可能にする十分なアノテーションを持っていない。
本稿では,フォトリアリスティックなオブジェクト中心データセットHM3D-ABOを提案する。
リアルな屋内シーンとリアルなオブジェクトを構成することで構築される。
各構成について,多視点RGB観測,物体用水密メッシュモデル,地中真理深度マップ,オブジェクトマスクを提供する。
提案するデータセットは,カメラポーズ推定や新視点合成などのタスクにも有用である。
データセット生成コードはhttps://github.com/zhenpeiyang/HM3D-ABOで公開されている。
関連論文リスト
- Zero-Shot Multi-Object Scene Completion [59.325611678171974]
1枚のRGB-D画像から複雑なシーンにおける複数の見えない物体の完全な形状を復元する3Dシーン補完法を提案する。
提案手法は, 合成および実世界の両方のデータセットにおいて, 現在の最先端技術よりも優れている。
論文 参考訳(メタデータ) (2024-03-21T17:59:59Z) - Anything-3D: Towards Single-view Anything Reconstruction in the Wild [61.090129285205805]
本稿では,一連の視覚言語モデルとSegment-Anythingオブジェクトセグメンテーションモデルを組み合わせた方法論的フレームワークであるAnything-3Dを紹介する。
提案手法では、BLIPモデルを用いてテキスト記述を生成し、Segment-Anythingモデルを用いて関心対象を効果的に抽出し、テキスト・画像拡散モデルを用いて物体を神経放射場へ持ち上げる。
論文 参考訳(メタデータ) (2023-04-19T16:39:51Z) - OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic
Perception, Reconstruction and Generation [107.71752592196138]
OmniObject3Dを提案する。OmniObject3Dは,大規模で高品質な3Dオブジェクトを持つ大語彙の3Dオブジェクトデータセットである。
190のカテゴリーで6,000のスキャン対象からなり、一般的な2Dデータセットと共通クラスを共有する。
それぞれの3Dオブジェクトは、2Dと3Dの両方のセンサーでキャプチャされ、テクスチャメッシュ、ポイントクラウド、マルチビューレンダリング画像、複数の実写ビデオを提供する。
論文 参考訳(メタデータ) (2023-01-18T18:14:18Z) - A Real World Dataset for Multi-view 3D Reconstruction [28.298548207213468]
日常のテーブルトップオブジェクトの371個の3Dモデルと,実世界のRGBと深度画像のデータセットを提示する。
私たちは主に、タスクに適切な実世界のベンチマークがないため、学習したマルチビューの3D再構成に注目し、データセットがそのギャップを埋めることを示す。
論文 参考訳(メタデータ) (2022-03-22T00:15:54Z) - ABO: Dataset and Benchmarks for Real-World 3D Object Understanding [43.42504014918771]
Amazon-Berkeley Objects (ABO)は、製品イメージと実際の家庭用オブジェクトに対応する3Dモデルの大規模なデータセットである。
合成オブジェクトをトレーニングした単一ビュー3D再構成ネットワークにおいて,ABOを用いてドメインギャップを測定する。
また、ABOのマルチビュー画像を用いて、異なるカメラ視点に対する最先端のメトリック学習アプローチの堅牢性を測定する。
論文 参考訳(メタデータ) (2021-10-12T17:52:42Z) - D3D-HOI: Dynamic 3D Human-Object Interactions from Videos [49.38319295373466]
本稿では,D3D-HOIについて紹介する。D3D-HOIは3次元オブジェクトのポーズ,形状,動きを,人間と物体の相互作用の時,地上の真理アノテーションを付加したモノクロビデオのデータセットである。
我々のデータセットは、様々な現実世界のシーンとカメラの視点から捉えた、いくつかの共通したオブジェクトで構成されている。
我々は、推定された3次元人間のポーズを利用して、物体の空間的レイアウトとダイナミクスをより正確に推定する。
論文 参考訳(メタデータ) (2021-08-19T00:49:01Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。