論文の概要: MATE: Masked Autoencoders are Online 3D Test-Time Learners
- arxiv url: http://arxiv.org/abs/2211.11432v1
- Date: Mon, 21 Nov 2022 13:19:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 21:19:29.382416
- Title: MATE: Masked Autoencoders are Online 3D Test-Time Learners
- Title(参考訳): MATE:masked Autoencodersはオンラインの3Dテストタイム学習者
- Authors: M. Jehanzeb Mirza, Inkyu Shin, Wei Lin, Andreas Schriebl, Kunyang Sun,
Jaesung Choe, Horst Possegger, Mateusz Kozinski, In So Kweon, Kun-Jin Yoon,
Horst Bischof
- Abstract要約: MATEは3Dデータ用に設計された最初のTTT(Test-Time-Training)手法である。
テストデータで発生する分散シフトに対して、ポイントクラウド分類でトレーニングされたディープネットワークを堅牢にする。
MATE は適応に必要な点の分数の観点から非常に効率的であることを示す。
- 参考スコア(独自算出の注目度): 63.3907730920114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose MATE, the first Test-Time-Training (TTT) method designed for 3D
data. It makes deep networks trained in point cloud classification robust to
distribution shifts occurring in test data, which could not be anticipated
during training. Like existing TTT methods, which focused on classifying 2D
images in the presence of distribution shifts at test-time, MATE also leverages
test data for adaptation. Its test-time objective is that of a Masked
Autoencoder: Each test point cloud has a large portion of its points removed
before it is fed to the network, tasked with reconstructing the full point
cloud. Once the network is updated, it is used to classify the point cloud. We
test MATE on several 3D object classification datasets and show that it
significantly improves robustness of deep networks to several types of
corruptions commonly occurring in 3D point clouds. Further, we show that MATE
is very efficient in terms of the fraction of points it needs for the
adaptation. It can effectively adapt given as few as 5% of tokens of each test
sample, which reduces its memory footprint and makes it lightweight. We also
highlight that MATE achieves competitive performance by adapting sparingly on
the test data, which further reduces its computational overhead, making it
ideal for real-time applications.
- Abstract(参考訳): 本稿では,3次元データを対象とした最初のテスト時間訓練(TTT)手法であるMATEを提案する。
これは、テストデータで発生する分散シフトに対して、ポイントクラウド分類でトレーニングされたディープネットワークを堅牢にする。
テスト時の分散シフトの存在下で2D画像の分類に重点を置いている既存のTTT方式と同様に、MATEはテストデータも活用している。
各テストポイントクラウドは、ネットワークに供給される前に、そのポイントの大部分を取り除き、フルポイントクラウドの再構築を行う。
ネットワークが更新されると、ポイントクラウドの分類に使用される。
我々は、複数の3次元オブジェクト分類データセット上でMATEを検証し、深層ネットワークのロバスト性を大幅に向上し、3Dポイントクラウドで一般的に発生するいくつかの種類の汚職に寄与することを示す。
さらに、MATE は適応に必要な点の分数の観点から非常に効率的であることを示す。
各テストサンプルのトークンの5%を効率的に適用することで、メモリフットプリントを削減し、軽量化することができる。
また、MATEはテストデータに緩やかに適応することで競合性能を実現し、その計算オーバーヘッドをさらに減らし、リアルタイムアプリケーションに最適であることも強調する。
関連論文リスト
- Test-Time Adaptation of 3D Point Clouds via Denoising Diffusion Models [19.795578581043745]
3Dポイントクラウドのテスト時間適応は、実世界のシナリオにおけるトレーニングとテストサンプルの相違を緩和するために不可欠である。
本稿では,3D Denoising Diffusion Test-Time Adaptationの略である3DD-TTAと呼ばれる新しい3Dテスト時間適応法を提案する。
論文 参考訳(メタデータ) (2024-11-21T00:04:38Z) - Test-Time Augmentation for 3D Point Cloud Classification and
Segmentation [40.62640761825697]
データ拡張は、ディープラーニングタスクのパフォーマンスを向上させるための強力なテクニックである。
本研究は,3次元点雲に対するTTA(Test-time augmentation)について検討する。
論文 参考訳(メタデータ) (2023-11-22T04:31:09Z) - AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud
Registration [69.21282992341007]
Auto Synthは、ポイントクラウド登録のための3Dトレーニングデータを自動的に生成する。
私たちはポイントクラウド登録ネットワークをもっと小さなサロゲートネットワークに置き換え、4056.43$のスピードアップを実現しました。
TUD-L,LINEMOD,Occluded-LINEMODに関する我々の研究結果は,検索データセットでトレーニングされたニューラルネットワークが,広く使用されているModelNet40データセットでトレーニングされたニューラルネットワークよりも一貫してパフォーマンスが向上していることを示す。
論文 参考訳(メタデータ) (2023-09-20T09:29:44Z) - Clustering based Point Cloud Representation Learning for 3D Analysis [80.88995099442374]
本稿では,ポイントクラウド分析のためのクラスタリングに基づく教師付き学習手法を提案する。
現在のデファクトでシーンワイドなトレーニングパラダイムとは異なり、我々のアルゴリズムは点埋め込み空間上でクラス内のクラスタリングを行う。
我々のアルゴリズムは、有名なポイントクラウドセグメンテーションデータセットの顕著な改善を示している。
論文 参考訳(メタデータ) (2023-07-27T03:42:12Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - TANet++: Triple Attention Network with Filtered Pointcloud on 3D
Detection [7.64943832687184]
TANetはKITTIおよびJRDBベンチマークにおける最先端の3Dオブジェクト検出手法の1つである。
本稿では,TANet++による3次元検出の性能向上を提案する。
弱いサンプルによる負の影響を減らすために、トレーニング戦略は以前トレーニングデータをフィルタリングし、TANet++は残りのデータによってトレーニングされる。
論文 参考訳(メタデータ) (2021-06-26T16:56:35Z) - MT3: Meta Test-Time Training for Self-Supervised Test-Time Adaption [69.76837484008033]
ディープラーニングの未解決の問題は、ニューラルネットワークがテスト時間中のドメインシフトに対処する能力である。
メタラーニング、自己監督、テストタイムトレーニングを組み合わせて、目に見えないテスト分布に適応する方法を学びます。
この手法はcifar-10による画像分類ベンチマークの最先端結果を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-30T09:33:38Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。