論文の概要: Primitive3D: 3D Object Dataset Synthesis from Randomly Assembled
Primitives
- arxiv url: http://arxiv.org/abs/2205.12627v1
- Date: Wed, 25 May 2022 10:07:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-26 15:16:03.953419
- Title: Primitive3D: 3D Object Dataset Synthesis from Randomly Assembled
Primitives
- Title(参考訳): プリミティブ3D:ランダム組立プリミティブからの3次元オブジェクトデータセット合成
- Authors: Xinke Li, Henghui Ding, Zekun Tong, Yuwei Wu, Yeow Meng Chee
- Abstract要約: アノテーションで大量の3Dオブジェクトを自動生成するコスト効率のよい手法を提案する。
これらのオブジェクトはプリミティブから派生した部分ラベルで自動アノテーションされる。
生成したデータセットに対する学習のオーバーヘッドが大きいことを考慮し,データセットの蒸留戦略を提案する。
- 参考スコア(独自算出の注目度): 44.03149443379618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous advancements in deep learning can be attributed to the access to
large-scale and well-annotated datasets. However, such a dataset is
prohibitively expensive in 3D computer vision due to the substantial collection
cost. To alleviate this issue, we propose a cost-effective method for
automatically generating a large amount of 3D objects with annotations. In
particular, we synthesize objects simply by assembling multiple random
primitives. These objects are thus auto-annotated with part labels originating
from primitives. This allows us to perform multi-task learning by combining the
supervised segmentation with unsupervised reconstruction. Considering the large
overhead of learning on the generated dataset, we further propose a dataset
distillation strategy to remove redundant samples regarding a target dataset.
We conduct extensive experiments for the downstream tasks of 3D object
classification. The results indicate that our dataset, together with multi-task
pretraining on its annotations, achieves the best performance compared to other
commonly used datasets. Further study suggests that our strategy can improve
the model performance by pretraining and fine-tuning scheme, especially for the
dataset with a small scale. In addition, pretraining with the proposed dataset
distillation method can save 86\% of the pretraining time with negligible
performance degradation. We expect that our attempt provides a new data-centric
perspective for training 3D deep models.
- Abstract(参考訳): ディープラーニングの多くの進歩は、大規模かつ注釈付きデータセットへのアクセスによるものである。
しかし、このようなデータセットは収集コストが大幅にかかるため、3dコンピュータビジョンでは極めて高価である。
この問題を軽減するために,アノテーションで大量の3Dオブジェクトを自動生成するコスト効率のよい手法を提案する。
特に、複数のランダムなプリミティブを組み立てることで、単にオブジェクトを合成する。
これらのオブジェクトは、プリミティブに由来する部分ラベルで自動アノテーションされる。
これにより,教師なしセグメンテーションと教師なしセグメンテーションを組み合わせたマルチタスク学習を実現する。
生成したデータセットの学習オーバーヘッドが大きいことを考慮し、ターゲットデータセットに関する冗長なサンプルを除去するデータセット蒸留戦略を提案する。
我々は3次元オブジェクト分類の下流タスクに対して広範な実験を行う。
その結果,我々のデータセットは,アノテーションを用いたマルチタスク事前トレーニングと合わせて,他の一般的なデータセットと比較して最高のパフォーマンスを実現していることがわかった。
さらに,本手法は,特に小規模のデータセットにおいて,事前学習と微調整によるモデル性能の向上を図っている。
また, 提案するデータセット蒸留法による事前訓練は, 性能劣化を伴わずに, 事前訓練時間の86\%を節約できる。
私たちの試みは、3d深層モデルのトレーニングに新たなデータ中心の視点を提供することを期待しています。
関連論文リスト
- The Why, When, and How to Use Active Learning in Large-Data-Driven 3D
Object Detection for Safe Autonomous Driving: An Empirical Exploration [1.2815904071470705]
エントロピークエリは、リソース制約のある環境でモデル学習を強化するデータを選択するための有望な戦略である。
この結果から,エントロピークエリは資源制約のある環境でのモデル学習を促進するデータ選択に有望な戦略であることが示唆された。
論文 参考訳(メタデータ) (2024-01-30T00:14:13Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast
Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。
このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。
我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文 参考訳(メタデータ) (2023-06-07T17:57:45Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Self-supervised Learning of 3D Object Understanding by Data Association
and Landmark Estimation for Image Sequence [15.815583594196488]
2D画像から下降する3Dオブジェクトは、減次元情報から副次元を推測する挑戦的なタスクです。
3Dアノテーションの達成は高価かつ時間を要するため、大量の3Dデータセットを得ることは困難である。
本研究では, 自己性能を克服するために, 画像シーケンス内の物体の多重観測を利用する戦略を提案する。
論文 参考訳(メタデータ) (2021-04-14T18:59:08Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。