Fugu-MT 論文翻訳(概要): In Search of Lost Online Test-time Adaptation: A Survey

論文の概要: In Search of Lost Online Test-time Adaptation: A Survey

arxiv url: http://arxiv.org/abs/2310.20199v1
Date: Tue, 31 Oct 2023 05:47:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-01 16:22:04.169068
Title: In Search of Lost Online Test-time Adaptation: A Survey
Title（参考訳）: オンラインテストタイム適応の損失の検索:サーベイ
Authors: Zixin Wang, Yadan Luo, Liang Zheng, Zhuoxiao Chen, Sen Wang, Zi Huang
Abstract要約: 本稿では、新しいデータ分布に機械学習モデルを適用することに焦点を当てた、オンラインテスト時間適応(OTTA)に関する総合的な調査を行う。我々はOTTAテクニックを3つの主要なカテゴリに分類し、それらをベンチマークに分類し、真に効果的な戦略を発見する。以上の結果から,(1)変圧器は多彩なドメインシフトに対して高いレジリエンスを示し,(2)多くのOTTA法の有効性は両バッチサイズに依存し,(3)適応時,特にバッチサイズが1。
参考スコア（独自算出の注目度）: 43.113712176561435
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In this paper, we present a comprehensive survey on online test-time adaptation (OTTA), a paradigm focused on adapting machine learning models to novel data distributions upon batch arrival. Despite the proliferation of OTTA methods recently, the field is mired in issues like ambiguous settings, antiquated backbones, and inconsistent hyperparameter tuning, obfuscating the real challenges and making reproducibility elusive. For clarity and a rigorous comparison, we classify OTTA techniques into three primary categories and subject them to benchmarks using the potent Vision Transformer (ViT) backbone to discover genuinely effective strategies. Our benchmarks span not only conventional corrupted datasets such as CIFAR-10/100-C and ImageNet-C but also real-world shifts embodied in CIFAR-10.1 and CIFAR-10-Warehouse, encapsulating variations across search engines and synthesized data by diffusion models. To gauge efficiency in online scenarios, we introduce novel evaluation metrics, inclusive of FLOPs, shedding light on the trade-offs between adaptation accuracy and computational overhead. Our findings diverge from existing literature, indicating: (1) transformers exhibit heightened resilience to diverse domain shifts, (2) the efficacy of many OTTA methods hinges on ample batch sizes, and (3) stability in optimization and resistance to perturbations are critical during adaptation, especially when the batch size is 1. Motivated by these insights, we pointed out promising directions for future research. The source code will be made available.
Abstract（参考訳）: 本稿では、バッチ到着時に新しいデータ分布に機械学習モデルを適用することに焦点を当てた、オンラインテスト時間適応(OTTA)に関する総合的な調査を行う。近年のottaメソッドの急増にもかかわらず、この分野は曖昧な設定、時代遅れのバックボーン、一貫性のないハイパーパラメータチューニングといった問題に潜んでいる。明快さと厳密な比較のために、OTTA手法を3つの主要なカテゴリに分類し、強力な視覚変換器(ViT)のバックボーンを用いてベンチマークを行い、真に効果的な戦略を発見する。ベンチマークは,cifar-10/100-cやimagenet-cといった従来型の破損したデータセットだけでなく,cifar-10.1やcifar-10-warehouseに具体化された実世界のシフトにも及ぶ。オンラインシナリオの効率を計測するために,フロップを包含する新しい評価指標を導入し,適応精度と計算オーバーヘッドのトレードオフを浮き彫りにする。その結果,(1)トランスフォーマは多様な領域シフトに対して高い反発性を示し,(2)多くのotta法の有効性は豊富なバッチサイズにかかっている,(3)最適化と摂動に対する耐性の安定性は適応中,特にバッチサイズが1。これらの知見に感銘を受け、将来的な研究の方向性を指摘した。ソースコードは公開される予定だ。

関連論文リスト

Conformal Prediction for Zero-Shot Models [20.94974284175104]
分割共形予測パラダイムに基づくCLIPモデルの能力について検討する。本稿では、キャリブレーションとクエリセットを併用してトランスダクティブを動作させるトランスダクティブ学習環境であるConf-OTを提案する。
論文参考訳（メタデータ） (2025-05-30T15:16:19Z)
Online Gaussian Test-Time Adaptation of Vision-Language Models [13.90714913643503]
オンラインガウス適応(英語: Online Gaussian Adaptation, OGA)は、ガウス分布を用いた視覚的特徴の可能性をモデル化する新しい手法である。 OGAは、ほとんどのデータセットや実行で最先端のメソッドよりも優れています。実験により,全OTTA法において,各データセットに対して平均3回以上の平均動作性能を示すOTTA評価プロトコルが不十分であることが判明した。
論文参考訳（メタデータ） (2025-01-08T08:49:52Z)
Visual Fourier Prompt Tuning [63.66866445034855]
本稿では,大規模なトランスフォーマーモデルに適用するための汎用的で効果的な方法として,Visual Fourier Prompt Tuning (VFPT)法を提案する。提案手法では,高速フーリエ変換を即時埋め込みに取り入れ,空間領域情報と周波数領域情報の両方を調和的に検討する。提案手法は,2つのベンチマークにおいて,現状のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2024-11-02T18:18:35Z)
CLAMP-ViT: Contrastive Data-Free Learning for Adaptive Post-Training Quantization of ViTs [6.456189487006878]
視覚変換器(ViT)のためのデータフリー後学習量子化法であるCLAMP-ViTを提案する。我々は、近年の手法の限界、特に意味のあるパッチ間の関係を活用できないことを特定する。 CLAMP-ViTは2段階のアプローチを採用し、データ生成とモデル量子化の間に循環的に適応する。
論文参考訳（メタデータ） (2024-07-07T05:39:25Z)
REP: Resource-Efficient Prompting for On-device Continual Learning [23.92661395403251]
オンデバイス連続学習(CL)は、モデル精度と資源効率の協調最適化を実践するために必要である。 CNNベースのCLは資源効率に優れており、ViTベースのCLはモデル性能に優れていると一般的に信じられている。本稿では,プロンプトベースのリハーサルフリー手法を特化して資源効率を向上させるREPを紹介する。
論文参考訳（メタデータ） (2024-06-07T09:17:33Z)
MoE-FFD: Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection [54.545054873239295]
ディープフェイクは、最近、国民の間で重大な信頼問題とセキュリティ上の懸念を提起した。 ViT法はトランスの表現性を生かし,優れた検出性能を実現する。この研究は、汎用的でパラメータ効率のよいViTベースのアプローチであるFace Forgery Detection (MoE-FFD)のためのMixture-of-Expertsモジュールを導入する。
論文参考訳（メタデータ） (2024-04-12T13:02:08Z)
Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文参考訳（メタデータ） (2023-07-26T09:47:37Z)
Benchmarking Test-Time Adaptation against Distribution Shifts in Image Classification [77.0114672086012]
テスト時間適応(TTA)は、予測時にのみラベルのないサンプルを活用することにより、モデルの一般化性能を向上させる技術である。本稿では,広く使用されている5つの画像分類データセット上で,13のTTA手法とその変種を体系的に評価するベンチマークを提案する。
論文参考訳（メタデータ） (2023-07-06T16:59:53Z)
Transformers for End-to-End InfoSec Tasks: A Feasibility Study [6.847381178288385]
私たちは2つの異なるInfoSecデータフォーマット、特にURLとPEファイルに対してトランスフォーマーモデルを実装します。 URLトランスフォーマーモデルは、高いパフォーマンスレベルに達するためには、異なるトレーニングアプローチが必要です。提案手法は,PEファイルのベンチマークデータセット上で,確立されたマルウェア検出モデルに相容れない性能を示す。
論文参考訳（メタデータ） (2022-12-05T23:50:46Z)
Semantic Perturbations with Normalizing Flows for Improved Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文参考訳（メタデータ） (2021-08-18T03:20:00Z)
On the Generalization Effects of Linear Transformations in Data Augmentation [32.01435459892255]
データ拡張は、画像やテキストの分類タスクのようなアプリケーションのパフォーマンスを改善するための強力な技術である。我々は線形変換の族を研究し、過度にパラメータ化された線形回帰設定におけるリッジ推定器への影響について研究する。本稿では,モデルが変換データに対してどの程度不確実であるかによって,変換空間を探索する拡張手法を提案する。
論文参考訳（メタデータ） (2020-05-02T04:10:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。