論文の概要: Fine-Grained 3D Shape Classification with Hierarchical Part-View
Attentions
- arxiv url: http://arxiv.org/abs/2005.12541v2
- Date: Mon, 28 Dec 2020 06:34:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 00:24:58.799705
- Title: Fine-Grained 3D Shape Classification with Hierarchical Part-View
Attentions
- Title(参考訳): 階層的部分視点による細粒度3次元形状分類
- Authors: Xinhai Liu, Zhizhong Han, Yu-Shen Liu, Matthias Zwicker
- Abstract要約: 本稿では,FG3D-Netと呼ばれる新しい3次元形状分類手法を提案する。
詳細な3次元形状データセットに基づく結果から,本手法が他の最先端手法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 70.0171362989609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained 3D shape classification is important for shape understanding and
analysis, which poses a challenging research problem. However, the studies on
the fine-grained 3D shape classification have rarely been explored, due to the
lack of fine-grained 3D shape benchmarks. To address this issue, we first
introduce a new 3D shape dataset (named FG3D dataset) with fine-grained class
labels, which consists of three categories including airplane, car and chair.
Each category consists of several subcategories at a fine-grained level.
According to our experiments under this fine-grained dataset, we find that
state-of-the-art methods are significantly limited by the small variance among
subcategories in the same category. To resolve this problem, we further propose
a novel fine-grained 3D shape classification method named FG3D-Net to capture
the fine-grained local details of 3D shapes from multiple rendered views.
Specifically, we first train a Region Proposal Network (RPN) to detect the
generally semantic parts inside multiple views under the benchmark of generally
semantic part detection. Then, we design a hierarchical part-view attention
aggregation module to learn a global shape representation by aggregating
generally semantic part features, which preserves the local details of 3D
shapes. The part-view attention module hierarchically leverages part-level and
view-level attention to increase the discriminability of our features. The
part-level attention highlights the important parts in each view while the
view-level attention highlights the discriminative views among all the views of
the same object. In addition, we integrate a Recurrent Neural Network (RNN) to
capture the spatial relationships among sequential views from different
viewpoints. Our results under the fine-grained 3D shape dataset show that our
method outperforms other state-of-the-art methods.
- Abstract(参考訳): 細粒度3次元形状分類は形状理解と解析において重要であり, 困難な研究課題となっている。
しかし,細粒度3d形状ベンチマークの欠如により,細粒度3d形状分類の研究はほとんど行われていない。
この問題に対処するために、飛行機、車、椅子を含む3つのカテゴリからなる、きめ細かいクラスラベルを持つ新しい3D形状データセット(FG3Dデータセット)を導入する。
各カテゴリは、きめ細かいレベルでいくつかのサブカテゴリから構成される。
この細粒度データセットによる実験により,同カテゴリのサブカテゴリ間の小さな分散により,最先端の手法が著しく制限されていることがわかった。
この問題を解決するため,我々はfg3d-netという新しい細粒度3d形状分類法を提案し,複数のレンダリングビューから3d形状の細粒度を捉えた。
具体的には、まず地域提案ネットワーク(RPN)をトレーニングし、一般的に意味的部分検出のベンチマークに基づいて、複数のビュー内の一般的な意味的部分を検出する。
そこで我々は,3次元形状の局所的な詳細を保存した,一般的な意味的特徴を集約することでグローバルな形状表現を学習する階層的な部分ビューアテンションアグリゲーションモジュールを設計する。
part-view attentionモジュールは、part-levelとview-level attentionを階層的に活用して、機能の識別性を高めます。
部分レベルの注目は各ビューの重要な部分を強調し、ビューレベルの注目は同一オブジェクトのすべてのビューの差別的なビューを強調します。
さらに、リカレントニューラルネットワーク(RNN)を統合し、異なる視点から逐次的なビュー間の空間的関係をキャプチャする。
細粒度3d形状データセットで得られた結果から,本手法は他の最先端手法よりも優れていた。
関連論文リスト
- Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance [49.14140194332482]
Open3DISは3Dシーン内でのOpen-Vocabulary Instanceの問題に対処するために設計された新しいソリューションである。
3D環境内のオブジェクトは、さまざまな形状、スケール、色を示し、正確なインスタンスレベルの識別が困難なタスクとなる。
論文 参考訳(メタデータ) (2023-12-17T10:07:03Z) - SAI3D: Segment Any Instance in 3D Scenes [68.57002591841034]
新規なゼロショット3Dインスタンスセグメンテーション手法であるSAI3Dを紹介する。
我々の手法は3Dシーンを幾何学的プリミティブに分割し、段階的に3Dインスタンスセグメンテーションにマージする。
ScanNet、Matterport3D、さらに難しいScanNet++データセットに関する実証的な評価は、我々のアプローチの優位性を示している。
論文 参考訳(メタデータ) (2023-12-17T09:05:47Z) - U3DS$^3$: Unsupervised 3D Semantic Scene Segmentation [19.706172244951116]
本稿では,U3DS$3$について,総合的な3Dシーンに対して,完全に教師なしのポイントクラウドセグメンテーションに向けたステップとして提示する。
提案手法の最初のステップは,各シーンの幾何学的特徴に基づいてスーパーポイントを生成することである。
次に、空間クラスタリングに基づく手法を用いて学習プロセスを行い、次いで、クラスタセントロイドに応じて生成された擬似ラベルを用いて反復的なトレーニングを行う。
論文 参考訳(メタデータ) (2023-11-10T12:05:35Z) - MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D
Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。
複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。
その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文 参考訳(メタデータ) (2022-08-18T00:48:15Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Topologically-Aware Deformation Fields for Single-View 3D Reconstruction [30.738926104317514]
本稿では,非整合なカテゴリ固有の画像収集から3次元オブジェクト形状と密接なオブジェクト対応を学習するための新しいフレームワークを提案する。
3次元形状は、カテゴリー固有符号距離場への変形として暗黙的に生成される。
TARSと呼ばれる我々の手法は、いくつかのデータセット上で最先端の再構築忠実性を実現する。
論文 参考訳(メタデータ) (2022-05-12T17:59:59Z) - Semi-supervised 3D shape segmentation with multilevel consistency and
part substitution [21.075426681857024]
本稿では,ラベル付3次元形状とラベル付3次元データの量から3次元分割を効果的に学習するための半教師付き手法を提案する。
ラベルのないデータに対して,3次元形状の摂動コピー間のネットワーク予測の整合性を確保するために,新しい多レベル整合性損失を提案する。
ラベル付きデータに対して,より構造的な変化を伴ってラベル付き3次元形状を増強し,トレーニングを強化するシンプルな部分置換法を開発した。
論文 参考訳(メタデータ) (2022-04-19T11:48:24Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。