論文の概要: PartCom: Part Composition Learning for 3D Open-Set Recognition
- arxiv url: http://arxiv.org/abs/2211.10880v1
- Date: Sun, 20 Nov 2022 06:27:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 20:15:47.386866
- Title: PartCom: Part Composition Learning for 3D Open-Set Recognition
- Title(参考訳): PartCom: 3次元オープンセット認識のためのパート構成学習
- Authors: Weng Tingyu, Xiao Jun, Jiang Haiyong
- Abstract要約: 我々は3Dオープンセット認識(OSR)に対処する試みを行っている。
そこで我々は,PartCom という新しい部分プロトタイプベースの OSR 手法を提案する。
我々はCAD形状データセットとスキャン形状データセットの両方に基づく3種類の3次元OSRタスクの実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D recognition is the foundation of 3D deep learning in many emerging fields,
such as autonomous driving and robotics.Existing 3D methods mainly focus on the
recognition of a fixed set of known classes and neglect possible unknown
classes during testing. These unknown classes may cause serious accidents in
safety-critical applications, i.e. autonomous driving. In this work, we make a
first attempt to address 3D open-set recognition (OSR) so that a classifier can
recognize known classes as well as be aware of unknown classes. We analyze
open-set risks in the 3D domain and point out the overconfidence and
under-representation problems that make existing methods perform poorly on the
3D OSR task. To resolve above problems, we propose a novel part prototype-based
OSR method named PartCom. We use part prototypes to represent a 3D shape as a
part composition, since a part composition can represent the overall structure
of a shape and can help distinguish different known classes and unknown ones.
Then we formulate two constraints on part prototypes to ensure their
effectiveness. To reduce open-set risks further, we devise a PUFS module to
synthesize unknown features as representatives of unknown samples by mixing up
part composite features of different classes. We conduct experiments on three
kinds of 3D OSR tasks based on both CAD shape dataset and scan shape dataset.
Extensive experiments show that our method is powerful in classifying known
classes and unknown ones and can attain much better results than SOTA baselines
on all 3D OSR tasks. The project will be released.
- Abstract(参考訳): 3D認識は、自律運転やロボット工学など、多くの新興分野における3D深層学習の基礎であり、既存の3D手法は主に、既知のクラスの固定された認識と、テスト中に未知のクラスを無視することに焦点を当てている。
これらの未知のクラスは、安全クリティカルな応用、すなわち自動運転において重大な事故を引き起こす可能性がある。
本研究では,3Dオープンセット認識(OSR)に対処する試みとして,既知のクラスを認識できるようにし,未知のクラスを認識できるようにした。
我々は,3D領域におけるオープンセットリスクを分析し,既存の手法が3D OSRタスクで不十分に動作するという,過剰な自信と表現不足の問題を指摘した。
上記の問題を解決するために、PartCom という新しい部分プロトタイプベースの OSR 手法を提案する。
部品構成は形状の全体構造を表現でき、既知のクラスと未知のものを区別するのに役立つため、部品のプロトタイプを用いて部品構成として3d形状を表現する。
そして、その効果を保証するために、部品プロトタイプに2つの制約を定式化します。
オープンセットのリスクを更に軽減するため,我々は,不明な特徴を未知のサンプルの代表として合成するためのpufsモジュールを考案した。
我々はCAD形状データセットとスキャン形状データセットの両方に基づく3種類の3次元OSRタスクの実験を行った。
大規模な実験により,本手法は既知のクラスや未知のクラスを分類する上で強力であり,全ての3次元OSRタスクにおけるSOTAベースラインよりもはるかに優れた結果が得られることが示された。
プロジェクトはリリースされます。
関連論文リスト
- Learning 3D Representations from Procedural 3D Programs [6.915871213703219]
自己教師付き学習は、ラベルのない3Dポイントクラウドから転送可能な3D表現を取得するための有望なアプローチとして登場した。
簡単なプリミティブと拡張を使って3次元形状を自動的に生成する手続き型3Dプログラムから3次元表現を学習する。
論文 参考訳(メタデータ) (2024-11-25T18:59:57Z) - Reasoning3D -- Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models [20.277479473218513]
オブジェクトの検索とローカライズのためのZero-Shot 3D Reasoningを提案する。
複雑なコマンドを理解し実行するためのシンプルなベースラインメソッドReasoning3Dを設計する。
Reasoning3Dは、暗黙のテキストクエリに基づいて、3Dオブジェクトの一部を効果的にローカライズし、ハイライトすることができることを示す。
論文 参考訳(メタデータ) (2024-05-29T17:56:07Z) - OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文 参考訳(メタデータ) (2024-03-28T17:05:04Z) - PonderV2: Pave the Way for 3D Foundation Model with A Universal
Pre-training Paradigm [114.47216525866435]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - Learning Occupancy for Monocular 3D Object Detection [25.56336546513198]
モノクローナル3次元検出のための占有度学習法であるtextbfOccupancy M3D を提案する。
フラストムと3D空間の占有を直接学習し、より差別的で情報的な3D特徴や表現をもたらす。
KITTIとオープンデータセットの実験により,提案手法が新たな最先端技術を実現し,他の手法をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2023-05-25T04:03:46Z) - Multiview Compressive Coding for 3D Reconstruction [77.95706553743626]
単一オブジェクトの3Dポイントやシーン全体で動作するシンプルなフレームワークを紹介します。
我々のモデルであるMultiview Compressive Codingは、入力の外観と形状を圧縮して3次元構造を予測する。
論文 参考訳(メタデータ) (2023-01-19T18:59:52Z) - SL3D: Self-supervised-Self-labeled 3D Recognition [89.19932178712065]
自己教師付き自己ラベル型3D認識(SL3D)フレームワークを提案する。
SL3Dはクラスタリングと学習機能表現という2つの結合した目的を同時に解決する。
分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな3D認識タスクに応用することができる。
論文 参考訳(メタデータ) (2022-10-30T11:08:25Z) - Towards Open Set 3D Learning: A Benchmark on Object Point Clouds [17.145309633743747]
本論文は,オープンセット3次元学習に関する第1報である。
カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。
本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
論文 参考訳(メタデータ) (2022-07-23T17:00:45Z) - Gait Recognition in the Wild with Dense 3D Representations and A
Benchmark [86.68648536257588]
既存の歩行認識の研究は、制約されたシーンにおける人間の体のシルエットや骨格のような2D表現によって支配されている。
本稿では,野生における歩行認識のための高密度な3次元表現の探索を目的とする。
大規模な3D表現に基づく歩行認識データセットGait3Dを構築した。
論文 参考訳(メタデータ) (2022-04-06T03:54:06Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。