論文の概要: What Makes for Effective Few-shot Point Cloud Classification?
- arxiv url: http://arxiv.org/abs/2304.00022v1
- Date: Fri, 31 Mar 2023 15:55:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 20:06:39.965472
- Title: What Makes for Effective Few-shot Point Cloud Classification?
- Title(参考訳): ショットポイントクラウドの効果的な分類には何が必要か?
- Authors: Chuangguan Ye, Hongyuan Zhu, Yongbin Liao, Yanggang Zhang, Tao Chen,
Jiayuan Fan
- Abstract要約: 非順序構造,高いクラス内分散,微妙なクラス間差など,3次元のショットラーニングの方が難易度が高いことを示す。
そこで我々は,クラス内差の増大と微妙なクラス間差問題に対処するため,Cross-Instance Adaptation (CIA)モジュールと呼ばれる新しいプラグイン・アンド・プレイ・コンポーネントを提案する。
- 参考スコア(独自算出の注目度): 18.62689395276194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the emergence of powerful computing resources and large-scale
annotated datasets, deep learning has seen wide applications in our daily life.
However, most current methods require extensive data collection and retraining
when dealing with novel classes never seen before. On the other hand, we humans
can quickly recognize new classes by looking at a few samples, which motivates
the recent popularity of few-shot learning (FSL) in machine learning
communities. Most current FSL approaches work on 2D image domain, however, its
implication in 3D perception is relatively under-explored. Not only needs to
recognize the unseen examples as in 2D domain, 3D few-shot learning is more
challenging with unordered structures, high intra-class variances, and subtle
inter-class differences. Moreover, different architectures and learning
algorithms make it difficult to study the effectiveness of existing 2D methods
when migrating to the 3D domain. In this work, for the first time, we perform
systematic and extensive studies of recent 2D FSL and 3D backbone networks for
benchmarking few-shot point cloud classification, and we suggest a strong
baseline and learning architectures for 3D FSL. Then, we propose a novel
plug-and-play component called Cross-Instance Adaptation (CIA) module, to
address the high intra-class variances and subtle inter-class differences
issues, which can be easily inserted into current baselines with significant
performance improvement. Extensive experiments on two newly introduced
benchmark datasets, ModelNet40-FS and ShapeNet70-FS, demonstrate the
superiority of our proposed network for 3D FSL.
- Abstract(参考訳): 強力なコンピューティングリソースと大規模アノテートデータセットの出現により、ディープラーニングは私たちの日常生活に広く応用されている。
しかし、現在のほとんどのメソッドは、これまで見たことのない新しいクラスを扱う場合、広範なデータ収集と再トレーニングを必要とする。
一方、人間はいくつかのサンプルを見てすぐに新しいクラスを認識できるため、機械学習コミュニティで最近FSLが人気になっている。
しかし、現在のFSLのアプローチのほとんどは2次元画像領域で動作するが、3次元知覚におけるその意味は比較的未解明である。
未知の例を2Dドメインのように認識するだけでなく、非順序構造、高いクラス内分散、微妙なクラス間差において、3Dの少数ショット学習はより困難である。
さらに、異なるアーキテクチャと学習アルゴリズムは、3Dドメインに移行する際に既存の2Dメソッドの有効性を研究するのを難しくする。
本研究では,最近の2次元fslおよび3次元バックボーンネットワークを体系的かつ広範囲に研究し,数点のクラウド分類をベンチマークし,3次元fslの強力なベースラインおよび学習アーキテクチャを提案する。
そこで我々は,Cross-Instance Adaptation (CIA) モジュールと呼ばれる新しいプラグイン・アンド・プレイコンポーネントを提案し,高いクラス内差と微妙なクラス間差の問題に対処する。
新たに導入された2つのベンチマークデータセットであるModelNet40-FSとShapeNet70-FSの大規模な実験は、提案した3次元FSLのネットワークの優位性を実証している。
関連論文リスト
- Foundation Model-Powered 3D Few-Shot Class Incremental Learning via Training-free Adaptor [9.54964908165465]
本稿では,3Dポイントクラウド環境におけるFew-Shot連続インクリメンタルラーニング問題に対処する新しい手法を提案する。
私たちは、ポイントクラウドデータに基づいて広範囲にトレーニングされた基礎的な3Dモデルを活用します。
このアプローチでは、二重キャッシュシステムを使用します。まず、モデルの予測にどれだけ自信があるかに基づいて、以前のテストサンプルを使用し、次に、オーバーフィッティングを防ぐために、少数の新しいタスクサンプルを含んでいます。
論文 参考訳(メタデータ) (2024-10-11T20:23:00Z) - OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文 参考訳(メタデータ) (2024-03-28T17:05:04Z) - Leveraging Large-Scale Pretrained Vision Foundation Models for
Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。
我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。
本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:41:15Z) - A Closer Look at Few-Shot 3D Point Cloud Classification [21.57893885371941]
本稿では,SPF (Salient-Part Fusion) モジュール,SCI+ (Self-Channel Interaction Plus) モジュール,CIF+ (Cross-Instance Fusion Plus) モジュールという3つの新しいプラグ・アンド・プレイコンポーネントを備えた新しいネットワーク PCIA を提案する。
これらのモジュールは、小さな変更を伴ってほとんどのFSLアルゴリズムに挿入でき、性能が大幅に向上する。
3つのベンチマークデータセット、ModelNet40-FS、ShapeNet70-FS、ScanObjectNN-FSの実験結果から,本手法が最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2023-03-31T17:01:13Z) - ULIP: Learning a Unified Representation of Language, Images, and Point
Clouds for 3D Understanding [110.07170245531464]
現在の3Dモデルは、注釈付きデータの少ないデータセットと、事前に定義されたカテゴリセットによって制限されている。
近年の進歩は、言語などの他のモダリティからの知識を活用することで、同様の問題を著しく軽減できることを示している。
画像,テキスト,3次元点雲の統一表現は,3つのモードからオブジェクト三重項を事前学習することで学習する。
論文 参考訳(メタデータ) (2022-12-10T01:34:47Z) - SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video
Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。
マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。
モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文 参考訳(メタデータ) (2022-07-16T19:25:41Z) - Multimodal Semi-Supervised Learning for 3D Objects [19.409295848915388]
本稿では,3次元の分類処理と検索処理の両方において,異なる3次元データのモデルのコヒーレンスを用いてデータ効率を向上させる方法について検討する。
本稿では、インスタンスレベルの一貫性制約を導入し、新しいマルチモーダル・コントラッシブ・プロトタイプ(M2CP)の損失を減らし、新しいマルチモーダル・セミ教師付き学習フレームワークを提案する。
提案するフレームワークは,モデルNet10およびモデルNet40データセットにおいて,分類タスクと検索タスクの両方において,最先端のすべての処理性能を大幅に上回っている。
論文 参考訳(メタデータ) (2021-10-22T05:33:16Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Learning without Forgetting for 3D Point Cloud Objects [7.761414660999872]
新しいクラスに対して、よく訓練されたディープラーニングモデルを微調整すると、ネットワークは新しい概念を学ぶが、古いトレーニングの知識を徐々に忘れていく。
本研究では,3次元データに対する知識蒸留技術について検討し,前回のトレーニングの破滅的な忘れ込みを減らすことを目的とした。
学習中に古い知識と新しい知識の相互関係を調べることは、古い知識を忘れずに新しい概念を学ぶのに役立つ。
論文 参考訳(メタデータ) (2021-06-27T16:39:39Z) - Zero-Shot Learning on 3D Point Cloud Objects and Beyond [21.6491982908705]
課題のいくつかを特定し,既存のモデルの性能を解析するために3次元領域に2次元ゼロショット学習(ZSL)手法を適用した。
観測された意味論とポイントクラウド機能を同時に調整する新しい損失関数を開発した。
幅広い実験が行われ、合成データセットと実データセットにZSLとGZSLの最先端を確立します。
論文 参考訳(メタデータ) (2021-04-11T10:04:06Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。