論文の概要: Empowering Knowledge Distillation via Open Set Recognition for Robust 3D
Point Cloud Classification
- arxiv url: http://arxiv.org/abs/2010.13114v1
- Date: Sun, 25 Oct 2020 13:26:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 04:48:50.034713
- Title: Empowering Knowledge Distillation via Open Set Recognition for Robust 3D
Point Cloud Classification
- Title(参考訳): ロバスト3次元点群分類のための開集合認識による知識蒸留
- Authors: Ayush Bhardwaj, Sakshee Pimpale, Saurabh Kumar, Biplab Banerjee
- Abstract要約: 本稿では,3次元物体認識のための知識蒸留とオープンセット認識の併用学習手法を提案する。
提案手法の有効性を,より小さなモデルを得るための様々な実験により実証する。
- 参考スコア(独自算出の注目度): 20.591508284285368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world scenarios pose several challenges to deep learning based computer
vision techniques despite their tremendous success in research. Deeper models
provide better performance, but are challenging to deploy and knowledge
distillation allows us to train smaller models with minimal loss in
performance. The model also has to deal with open set samples from classes
outside the ones it was trained on and should be able to identify them as
unknown samples while classifying the known ones correctly. Finally, most
existing image recognition research focuses only on using two-dimensional
snapshots of the real world three-dimensional objects. In this work, we aim to
bridge these three research fields, which have been developed independently
until now, despite being deeply interrelated. We propose a joint Knowledge
Distillation and Open Set recognition training methodology for
three-dimensional object recognition. We demonstrate the effectiveness of the
proposed method via various experiments on how it allows us to obtain a much
smaller model, which takes a minimal hit in performance while being capable of
open set recognition for 3D point cloud data.
- Abstract(参考訳): 現実世界のシナリオは、非常に成功した研究にもかかわらず、ディープラーニングベースのコンピュータビジョン技術にいくつかの課題をもたらす。
より深いモデルはより良いパフォーマンスを提供するが、デプロイや知識の蒸留は困難であり、より小さなモデルを最小限のパフォーマンスで訓練することができる。
モデルはトレーニング対象外のクラスからのオープンセットのサンプルも扱う必要があり、既知のサンプルを正しく分類しながら、未知のサンプルとして識別することが可能になる。
最後に、既存の画像認識研究のほとんどは、現実世界の3次元オブジェクトの2次元スナップショットの使用のみに焦点を当てている。
本研究は,これら3つの研究分野を橋渡しすることを目的としている。
本稿では,3次元物体認識のための共同知識蒸留と開集合認識訓練手法を提案する。
提案手法は,3dポイントクラウドデータのオープンセット認識を可能としながら,より小さなモデルを実現するための様々な実験を通して,提案手法の有効性を実証する。
関連論文リスト
- Generalized Label-Efficient 3D Scene Parsing via Hierarchical Feature
Aligned Pre-Training and Region-Aware Fine-tuning [55.517000360348725]
本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。
事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。
室内と屋外の両方で実験を行ったところ、データ効率のよい学習とオープンワールドの複数ショット学習の両方において、我々のアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-12-01T15:47:04Z) - Leveraging Large-Scale Pretrained Vision Foundation Models for
Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。
我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。
本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:41:15Z) - OpenPatch: a 3D patchwork for Out-Of-Distribution detection [16.262921993755892]
そこで本研究では,実世界のクラウドサンプルに対して,参照既知のデータが合成された場合のセマンティックノベルティ検出の課題について述べる。
OpenPatchは、トレーニング済みの大きなモデルの上に構築され、その中間機能から、既知の各クラスを記述するパッチ表現のセットを単純に抽出する。
OpenPatchは、全例と数例の既知のサンプルシナリオの両方で優れていることを実証します。
論文 参考訳(メタデータ) (2023-10-05T08:49:51Z) - On-Device Constrained Self-Supervised Speech Representation Learning for
Keyword Spotting via Knowledge Distillation [13.08005728839078]
オンデバイスキーワードスポッティングのための知識蒸留に基づく自己教師型音声表現学習アーキテクチャを提案する。
私たちのアプローチでは、より大きく複雑なモデルからより小さくて軽量なモデルに知識を移すために、教師中心のフレームワークを使用しました。
我々は、社内データセットを用いて、Alexaキーワードスポッティング検出タスクでモデルの性能を評価した。
論文 参考訳(メタデータ) (2023-07-06T02:03:31Z) - Fine-grained 3D object recognition: an approach and experiments [0.0]
3次元物体認識技術は、自動車の自律運転などの先進技術における中核技術として利用されている。
i)Global Orthographic Object Descriptor (GOOD)のような手作りのアプローチと、(ii)MobileNetやVGGのようなディープラーニングベースのアプローチである。
本稿では,オブジェクトビューを入力とし,カテゴリラベルを出力として生成するオフライン3Dオブジェクト認識システムを最初に実装した。
オフラインの段階では、インスタンスベースの学習(IBL)が新しいものを形成するために使用される
論文 参考訳(メタデータ) (2023-06-28T04:48:21Z) - Explore In-Context Learning for 3D Point Cloud Understanding [71.20912026561484]
我々は,特に3Dポイントクラウドにおけるコンテキスト内学習のために設計された,ポイント・イン・コンテキストという新しいフレームワークを紹介した。
一般点サンプリング演算子とタンデムで協調して動作するように慎重に設計したJoint Smplingモジュールを提案する。
提案手法の汎用性と適応性を検証するため,幅広いタスクを扱うための広範囲な実験を行った。
論文 参考訳(メタデータ) (2023-06-14T17:53:21Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Advancing 3D finger knuckle recognition via deep feature learning [51.871256510747465]
接触のない3Dフィンガーナックルパターンは、識別性、距離からの視認性、利便性、利便性により、効果的な生体認証として出現している。
近年、ディープニューラルネットワークの中間機能を複数のスケールで同時に組み込むディープ・フィーチャー・コラボレーティブ・ネットワークが開発されている。
本稿では,3次元指のナックル画像を表現するために,最小次元の識別特徴ベクトルを学習する可能性を検討することにより,本手法を推し進める。
論文 参考訳(メタデータ) (2023-01-07T20:55:16Z) - Lifelong Ensemble Learning based on Multiple Representations for
Few-Shot Object Recognition [6.282068591820947]
本稿では,複数表現に基づく一生涯のアンサンブル学習手法を提案する。
生涯学習を容易にするため、各アプローチは、オブジェクト情報を即座に保存して検索するメモリユニットを備える。
提案手法の有効性を,オフラインおよびオープンエンドシナリオで評価するために,幅広い実験を行った。
論文 参考訳(メタデータ) (2022-05-04T10:29:10Z) - Anomaly Detection in Video via Self-Supervised and Multi-Task Learning [113.81927544121625]
ビデオにおける異常検出は、コンピュータビジョンの問題である。
本稿では,オブジェクトレベルでの自己教師型およびマルチタスク学習を通じて,ビデオ中の異常事象検出にアプローチする。
論文 参考訳(メタデータ) (2020-11-15T10:21:28Z) - Joint Supervised and Self-Supervised Learning for 3D Real-World
Challenges [16.328866317851187]
ポイントクラウド処理と3D形状理解は、ディープラーニング技術が大きな可能性を実証する難しいタスクである。
ここでは、データ不足と大きなドメインギャップにより教師付き学習が失敗する合成および実世界の点雲を含むいくつかのシナリオについて考察する。
形状分類や部分分割の主課題を学習しながら3次元パズルを解くマルチタスクモデルにより、自己超越を利用して、標準的な特徴表現を豊かにすることを提案する。
論文 参考訳(メタデータ) (2020-04-15T23:34:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。