論文の概要: InOR-Net: Incremental 3D Object Recognition Network for Point Cloud
Representation
- arxiv url: http://arxiv.org/abs/2302.09886v1
- Date: Mon, 20 Feb 2023 10:30:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 15:51:32.904796
- Title: InOR-Net: Incremental 3D Object Recognition Network for Point Cloud
Representation
- Title(参考訳): InOR-Net:ポイントクラウド表現のためのインクリメンタル3次元オブジェクト認識ネットワーク
- Authors: Jiahua Dong, Yang Cong, Gan Sun, Lixu Wang, Lingjuan Lyu, Jun Li, and
Ender Konukoglu
- Abstract要約: 我々は,新しい3Dオブジェクトのクラスを連続的に認識するインクリメンタル3Dオブジェクト認識ネットワーク(InOR-Net)を開発した。
具体的には、各クラスの特徴的な3次元特性を持つ局所幾何学的構造を推論するために、カテゴリー誘導幾何学的推論を提案する。
そこで我々は,従来の3Dオブジェクトのクラスにおける破滅的な忘れを克服するために,各クラス内のどの3次元幾何学的特徴が有用であるかを識別する,新しい批評家による幾何学的注意機構を提案する。
- 参考スコア(独自算出の注目度): 51.121731449575776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D object recognition has successfully become an appealing research topic in
the real-world. However, most existing recognition models unreasonably assume
that the categories of 3D objects cannot change over time in the real-world.
This unrealistic assumption may result in significant performance degradation
for them to learn new classes of 3D objects consecutively, due to the
catastrophic forgetting on old learned classes. Moreover, they cannot explore
which 3D geometric characteristics are essential to alleviate the catastrophic
forgetting on old classes of 3D objects. To tackle the above challenges, we
develop a novel Incremental 3D Object Recognition Network (i.e., InOR-Net),
which could recognize new classes of 3D objects continuously via overcoming the
catastrophic forgetting on old classes. Specifically, a category-guided
geometric reasoning is proposed to reason local geometric structures with
distinctive 3D characteristics of each class by leveraging intrinsic category
information. We then propose a novel critic-induced geometric attention
mechanism to distinguish which 3D geometric characteristics within each class
are beneficial to overcome the catastrophic forgetting on old classes of 3D
objects, while preventing the negative influence of useless 3D characteristics.
In addition, a dual adaptive fairness compensations strategy is designed to
overcome the forgetting brought by class imbalance, by compensating biased
weights and predictions of the classifier. Comparison experiments verify the
state-of-the-art performance of the proposed InOR-Net model on several public
point cloud datasets.
- Abstract(参考訳): 3Dオブジェクト認識は、現実世界で魅力的な研究トピックとなっている。
しかし、既存の認識モデルの多くは、3Dオブジェクトのカテゴリが現実世界の時間とともに変化しないと不当に仮定している。
この非現実的な仮定は、3Dオブジェクトの新しいクラスを連続的に学習する上で大きなパフォーマンス劣化をもたらす可能性がある。
さらに、3Dオブジェクトの古いクラスにおける破滅的な忘れを緩和するためには、どの3次元幾何学的特徴が不可欠かを探ることができない。
以上の課題に対処するため,我々は,古いクラスにおける破滅的な忘れを克服して,新しい3Dオブジェクトのクラスを連続的に認識できる新しいインクリメンタル3Dオブジェクト認識ネットワーク(Inor-Net)を開発した。
具体的には,各クラス固有の3次元特徴を持つ局所幾何学的構造を,内在的カテゴリ情報を利用して推論する。
そこで本研究では,従来の3次元物体の破壊的忘れ去れを克服するために,各クラス内の3次元幾何学的特徴を識別する新しい批判的幾何学的注意機構を提案する。
さらに,偏り重みと分類器の予測を補償することにより,クラス不均衡がもたらした忘れを克服するために,二重適応フェアネス補償戦略を考案した。
比較実験は、いくつかのパブリッククラウドデータセット上で提案したInOR-Netモデルの最先端性能を検証する。
関連論文リスト
- GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文 参考訳(メタデータ) (2024-12-12T17:59:03Z) - Collaborative Novel Object Discovery and Box-Guided Cross-Modal Alignment for Open-Vocabulary 3D Object Detection [34.91703960513125]
CoDAv2は、新しい3Dオブジェクトのローカライズと分類の両方に取り組むために設計された統一フレームワークである。
CoDAv2は、高いマージンで最高のパフォーマンスの方法より優れている。
ソースコードと事前トレーニングされたモデルはGitHubプロジェクトページで公開されている。
論文 参考訳(メタデータ) (2024-06-02T18:32:37Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Uncertainty-aware 3D Object-Level Mapping with Deep Shape Priors [15.34487368683311]
未知のオブジェクトに対して高品質なオブジェクトレベルマップを再構築するフレームワークを提案する。
提案手法では,複数のRGB-D画像を入力として,高密度な3次元形状と検出対象に対する9-DoFポーズを出力する。
2つの新たな損失関数を通して形状を伝播し不確実性を生じさせる確率的定式化を導出する。
論文 参考訳(メタデータ) (2023-09-17T00:48:19Z) - Large-Vocabulary 3D Diffusion Model with Transformer [57.076986347047]
本稿では,1つの生成モデルを用いて実世界の3Dオブジェクトの大規模カテゴリを合成するための拡散型フィードフォワードフレームワークを提案する。
本稿では,三面体を用いた3次元拡散モデル(TransFormer, DiffTF)を提案する。
ShapeNetとOmniObject3Dの実験は、単一のDiffTFモデルが最先端の大語彙3Dオブジェクト生成性能を達成することを確実に実証している。
論文 参考訳(メタデータ) (2023-09-14T17:59:53Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - I3DOL: Incremental 3D Object Learning without Catastrophic Forgetting [38.7610646073842]
i3dolはまず、3dオブジェクトの新しいクラスを継続的に学習する。
アダプティブジオメトリックセントロイドモジュールは、識別可能な局所幾何学構造を構築するように設計されています。
局所幾何学構造の寄与度を定量化する幾何学的注意メカニズムが開発された。
論文 参考訳(メタデータ) (2020-12-16T15:17:51Z) - Fine-Grained 3D Shape Classification with Hierarchical Part-View
Attentions [70.0171362989609]
本稿では,FG3D-Netと呼ばれる新しい3次元形状分類手法を提案する。
詳細な3次元形状データセットに基づく結果から,本手法が他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-26T06:53:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。