論文の概要: MATE: Masked Autoencoders are Online 3D Test-Time Learners
- arxiv url: http://arxiv.org/abs/2211.11432v3
- Date: Mon, 20 Mar 2023 09:44:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 01:46:09.506629
- Title: MATE: Masked Autoencoders are Online 3D Test-Time Learners
- Title(参考訳): MATE:masked Autoencodersはオンラインの3Dテストタイム学習者
- Authors: M. Jehanzeb Mirza, Inkyu Shin, Wei Lin, Andreas Schriebl, Kunyang Sun,
Jaesung Choe, Horst Possegger, Mateusz Kozinski, In So Kweon, Kun-Jin Yoon,
Horst Bischof
- Abstract要約: MATEは3Dデータ用に設計された最初のTTT(Test-Time-Training)手法である。
テストデータで発生する分散シフトに対して、ポイントクラウド分類のためにトレーニングされたディープネットワークを堅牢にする。
- 参考スコア(独自算出の注目度): 63.3907730920114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our MATE is the first Test-Time-Training (TTT) method designed for 3D data,
which makes deep networks trained for point cloud classification robust to
distribution shifts occurring in test data. Like existing TTT methods from the
2D image domain, MATE also leverages test data for adaptation. Its test-time
objective is that of a Masked Autoencoder: a large portion of each test point
cloud is removed before it is fed to the network, tasked with reconstructing
the full point cloud. Once the network is updated, it is used to classify the
point cloud. We test MATE on several 3D object classification datasets and show
that it significantly improves robustness of deep networks to several types of
corruptions commonly occurring in 3D point clouds. We show that MATE is very
efficient in terms of the fraction of points it needs for the adaptation. It
can effectively adapt given as few as 5% of tokens of each test sample, making
it extremely lightweight. Our experiments show that MATE also achieves
competitive performance by adapting sparsely on the test data, which further
reduces its computational overhead, making it ideal for real-time applications.
- Abstract(参考訳): 我々のMATEは3次元データ用に設計された最初のテスト時間評価(TTT)手法であり、テストデータに発生する分散シフトに頑健なポイントクラウド分類のためにトレーニングされたディープネットワークを実現する。
2D画像領域からの既存のTTメソッドと同様に、MATEはテストデータも活用する。
テスト時間の目的は、マスク付きオートエンコーダである。 各テストポイントクラウドの大部分は、ネットワークに供給される前に削除され、フルポイントクラウドの再構築が処理される。
ネットワークが更新されると、ポイントクラウドの分類に使用される。
我々は、複数の3次元オブジェクト分類データセット上でMATEを検証し、深層ネットワークのロバスト性を大幅に向上し、3Dポイントクラウドで一般的に発生するいくつかの種類の汚職に寄与することを示す。
MATE は適応に必要な点の分数の観点から非常に効率的であることを示す。
各テストサンプルのトークンの5%しか与えられず、効果的に適応することができ、非常に軽量である。
実験の結果,MATEはテストデータに微少に適応することで,その計算オーバーヘッドを低減し,リアルタイムアプリケーションに最適であることを示す。
関連論文リスト
- Test-Time Adaptation of 3D Point Clouds via Denoising Diffusion Models [19.795578581043745]
3Dポイントクラウドのテスト時間適応は、実世界のシナリオにおけるトレーニングとテストサンプルの相違を緩和するために不可欠である。
本稿では,3D Denoising Diffusion Test-Time Adaptationの略である3DD-TTAと呼ばれる新しい3Dテスト時間適応法を提案する。
論文 参考訳(メタデータ) (2024-11-21T00:04:38Z) - Test-Time Augmentation for 3D Point Cloud Classification and
Segmentation [40.62640761825697]
データ拡張は、ディープラーニングタスクのパフォーマンスを向上させるための強力なテクニックである。
本研究は,3次元点雲に対するTTA(Test-time augmentation)について検討する。
論文 参考訳(メタデータ) (2023-11-22T04:31:09Z) - AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud
Registration [69.21282992341007]
Auto Synthは、ポイントクラウド登録のための3Dトレーニングデータを自動的に生成する。
私たちはポイントクラウド登録ネットワークをもっと小さなサロゲートネットワークに置き換え、4056.43$のスピードアップを実現しました。
TUD-L,LINEMOD,Occluded-LINEMODに関する我々の研究結果は,検索データセットでトレーニングされたニューラルネットワークが,広く使用されているModelNet40データセットでトレーニングされたニューラルネットワークよりも一貫してパフォーマンスが向上していることを示す。
論文 参考訳(メタデータ) (2023-09-20T09:29:44Z) - Clustering based Point Cloud Representation Learning for 3D Analysis [80.88995099442374]
本稿では,ポイントクラウド分析のためのクラスタリングに基づく教師付き学習手法を提案する。
現在のデファクトでシーンワイドなトレーニングパラダイムとは異なり、我々のアルゴリズムは点埋め込み空間上でクラス内のクラスタリングを行う。
我々のアルゴリズムは、有名なポイントクラウドセグメンテーションデータセットの顕著な改善を示している。
論文 参考訳(メタデータ) (2023-07-27T03:42:12Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - TANet++: Triple Attention Network with Filtered Pointcloud on 3D
Detection [7.64943832687184]
TANetはKITTIおよびJRDBベンチマークにおける最先端の3Dオブジェクト検出手法の1つである。
本稿では,TANet++による3次元検出の性能向上を提案する。
弱いサンプルによる負の影響を減らすために、トレーニング戦略は以前トレーニングデータをフィルタリングし、TANet++は残りのデータによってトレーニングされる。
論文 参考訳(メタデータ) (2021-06-26T16:56:35Z) - MT3: Meta Test-Time Training for Self-Supervised Test-Time Adaption [69.76837484008033]
ディープラーニングの未解決の問題は、ニューラルネットワークがテスト時間中のドメインシフトに対処する能力である。
メタラーニング、自己監督、テストタイムトレーニングを組み合わせて、目に見えないテスト分布に適応する方法を学びます。
この手法はcifar-10による画像分類ベンチマークの最先端結果を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-30T09:33:38Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。