論文の概要: Learning from Random Subspace Exploration: Generalized Test-Time Augmentation with Self-supervised Distillation
- arxiv url: http://arxiv.org/abs/2507.01347v1
- Date: Wed, 02 Jul 2025 04:30:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:23:00.043483
- Title: Learning from Random Subspace Exploration: Generalized Test-Time Augmentation with Self-supervised Distillation
- Title(参考訳): ランダム部分空間探索からの学習:自己監督蒸留による一般試験時間拡張
- Authors: Andrei Jelea, Ahmed Nabil Belbachir, Marius Leordeanu,
- Abstract要約: GTTA(Generalized Test-Time Augmentation)は、訓練されたモデルの性能を向上させるための非常に効果的な手法である。
低視認性水中ビデオにおけるサーモンのセグメンテーションと検出という,より具体的な現実世界のタスクにおいて,その効果を実証する。
- 参考スコア(独自算出の注目度): 8.511846002129522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Generalized Test-Time Augmentation (GTTA), a highly effective method for improving the performance of a trained model, which unlike other existing Test-Time Augmentation approaches from the literature is general enough to be used off-the-shelf for many vision and non-vision tasks, such as classification, regression, image segmentation and object detection. By applying a new general data transformation, that randomly perturbs multiple times the PCA subspace projection of a test input, GTTA forms robust ensembles at test time in which, due to sound statistical properties, the structural and systematic noises in the initial input data is filtered out and final estimator errors are reduced. Different from other existing methods, we also propose a final self-supervised learning stage in which the ensemble output, acting as an unsupervised teacher, is used to train the initial single student model, thus reducing significantly the test time computational cost, at no loss in accuracy. Our tests and comparisons to strong TTA approaches and SoTA models on various vision and non-vision well-known datasets and tasks, such as image classification and segmentation, speech recognition and house price prediction, validate the generality of the proposed GTTA. Furthermore, we also prove its effectiveness on the more specific real-world task of salmon segmentation and detection in low-visibility underwater videos, for which we introduce DeepSalmon, the largest dataset of its kind in the literature.
- Abstract(参考訳): GTTA(Generalized Test-Time Augmentation)は、既存のテスト時間拡張手法とは異なり、分類、回帰、イメージセグメンテーション、オブジェクト検出といった多くの視覚的・非視覚的タスクにおいて、本研究の現場で使われるのが一般的である。
テスト入力のPCA部分空間投影を複数回ランダムに摂動させる新しい汎用データ変換を適用することにより、GTTAは、音響統計的特性により、初期入力データの構造的および体系的なノイズを除去し、最終的な推定誤差を低減するテスト時に堅牢なアンサンブルを形成する。
既存の他の方法と異なり、教師なしの教師として機能するアンサンブル出力を用いて、最初のシングル学生モデルを訓練し、精度を損なわずにテスト時間計算コストを大幅に削減する、最終的な自己教師型学習ステージも提案する。
画像分類やセグメンテーション,音声認識,住宅価格予測など,様々なビジョンや非ビジョンのよく知られたデータセットやタスクを用いた強力なTTAアプローチとSoTAモデルとの比較を行い,提案したGTTAの汎用性を検証する。
さらに,本研究では,より具体的なサケのセグメンテーションと検出の課題に対して,その効果を実証し,本研究で最大のデータセットであるDeepSalmonを紹介した。
関連論文リスト
- BoostAdapter: Improving Vision-Language Test-Time Adaptation via Regional Bootstrapping [64.8477128397529]
本稿では,テスト時間適応フレームワークを提案する。
我々は、インスタンスに依存しない履歴サンプルとインスタンスを意識したブースティングサンプルから特徴を検索するための軽量なキー値メモリを維持している。
理論的には,本手法の背後にある合理性を正当化し,アウト・オブ・ディストリビューションとクロスドメイン・データセットの両方において,その有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-20T15:58:43Z) - Early-Stage Anomaly Detection: A Study of Model Performance on Complete vs. Partial Flows [0.0]
本研究では,部分フロー情報と完全フロー情報の臨界レンズによるネットワークセキュリティ脅威検出における機械学習モデルの有効性について検討した。
標準ベンチマークモデルであるランダムフォレスト(Random Forest)が、様々なトレーニングおよびテスト条件下でどのように機能するかを評価する。
論文 参考訳(メタデータ) (2024-07-03T07:14:25Z) - BaFTA: Backprop-Free Test-Time Adaptation For Zero-Shot Vision-Language Models [20.88680592729709]
本稿では,視覚言語モデルの試験時間適応のためのバックプロパゲーションフリーアルゴリズムBaFTAを提案する。
BaFTAは、投影された埋め込み空間内のオンラインクラスタリングを使用して、クラスセントロイドを直接推定する。
我々は,BaFTAが最先端の試験時間適応手法を効率と効率の両方で一貫して上回っていることを実証した。
論文 参考訳(メタデータ) (2024-06-17T08:16:24Z) - A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts [117.72709110877939]
テスト時間適応(TTA)は、事前訓練されたモデルをテスト中に、予測する前にラベルのないデータに適応する可能性がある。
TTAはテスト時間領域適応、テスト時間バッチ適応、オンラインテスト時間適応といったテストデータの形態に基づいて、いくつかの異なるグループに分類される。
論文 参考訳(メタデータ) (2023-03-27T16:32:21Z) - DELTA: degradation-free fully test-time adaptation [59.74287982885375]
テスト時間バッチ正規化(BN)や自己学習といった,一般的な適応手法では,2つの好ましくない欠陥が隠されていることがわかった。
まず、テスト時間BNにおける正規化統計は、現在受信されているテストサンプルに完全に影響され、その結果、不正確な推定結果が得られることを明らかにする。
第二に、テスト時間適応中にパラメータ更新が支配的なクラスに偏っていることを示す。
論文 参考訳(メタデータ) (2023-01-30T15:54:00Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。