Fugu-MT 論文翻訳(概要): Elastic Weight Consolidation Improves the Robustness of Self-Supervised Learning Methods under Transfer

論文の概要: Elastic Weight Consolidation Improves the Robustness of Self-Supervised Learning Methods under Transfer

arxiv url: http://arxiv.org/abs/2210.16365v1
Date: Fri, 28 Oct 2022 19:00:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-01 18:04:09.348703
Title: Elastic Weight Consolidation Improves the Robustness of Self-Supervised Learning Methods under Transfer
Title（参考訳）: 弾性重み強化による自己教師あり学習法のロバスト性の向上
Authors: Andrius Ovsianas, Jason Ramapuram, Dan Busbridge, Eeshan Gunesh Dhekane, Russ Webb
Abstract要約: 自己教師付き表現学習(SSL)手法は、下流タスクの微調整に有効なラベルなし初期条件を提供する。我々はベイジアン連続学習のレンズの下でSSLの微調整を再解釈し、Elastic Weight Consolidation (EWC)フレームワークによる正規化を検討する。初期SSLバックボーンに対する自己正規化は、ウォーターバードの最低サブグループ性能を5%改善し、Celeb-Aを2%向上させることを示した。
参考スコア（独自算出の注目度）: 4.2141621237414615
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Self-supervised representation learning (SSL) methods provide an effective label-free initial condition for fine-tuning downstream tasks. However, in numerous realistic scenarios, the downstream task might be biased with respect to the target label distribution. This in turn moves the learned fine-tuned model posterior away from the initial (label) bias-free self-supervised model posterior. In this work, we re-interpret SSL fine-tuning under the lens of Bayesian continual learning and consider regularization through the Elastic Weight Consolidation (EWC) framework. We demonstrate that self-regularization against an initial SSL backbone improves worst sub-group performance in Waterbirds by 5% and Celeb-A by 2% when using the ViT-B/16 architecture. Furthermore, to help simplify the use of EWC with SSL, we pre-compute and publicly release the Fisher Information Matrix (FIM), evaluated with 10,000 ImageNet-1K variates evaluated on large modern SSL architectures including ViT-B/16 and ResNet50 trained with DINO.
Abstract（参考訳）: 自己教師付き表現学習(SSL)手法は、下流タスクの微調整に有効なラベルなし初期条件を提供する。しかし、多くの現実的なシナリオでは、下流のタスクはターゲットラベルの分布に関してバイアスを受けることがある。これにより、学習した微調整されたモデルを初期(ラベルなし)バイアスのない自己教師付きモデル後部から遠ざける。本研究では,ベイジアン連続学習のレンズの下でSSLの微調整を再解釈し,弾性重み統合(EWC)フレームワークによる正規化を検討する。初期SSLバックボーンに対する自己正規化は、VT-B/16アーキテクチャを使用する場合、ウォーターバードの最低サブグループ性能を5%改善し、Celeb-Aを2%向上させることを示した。さらに、SSLでのEWCの使用を簡略化するために、DINOでトレーニングされたViT-B/16やResNet50など、大規模なSSLアーキテクチャで評価された1万のImageNet-1Kで評価されたFisher Information Matrix(FIM)を事前計算して公開する。

関連論文リスト

Revisiting semi-supervised learning in the era of foundation models [28.414667991336067]
半教師付き学習(SSL)は、ラベル付きデータとともに豊富なラベル付きデータを活用して学習を強化する。我々は,凍結視覚基盤モデル(VFM)が性能的に劣るSSLベンチマークデータセットを開発し,代表的なSSLメソッドを体系的に評価する。ラベル付きデータのみを用いたパラメータ効率細調整(PEFT)は、ラベルなしデータを活用することなく、SSLのパフォーマンスとよく一致します。ノイズの多い擬似ラベルの悪名高い問題を克服するため,より堅牢な擬似ラベルを生成するために,複数のPEFTアプローチとVFMバックボーンのアンサンブルを提案する。
論文参考訳（メタデータ） (2025-03-12T18:01:10Z)
BiSSL: Enhancing the Alignment Between Self-Supervised Pretraining and Downstream Fine-Tuning via Bilevel Optimization [12.749627564482282]
BiSSLは、微調整の前に下流タスクと自己教師付き事前訓練されたモデルのアライメントを強化する、新しいバイレベルトレーニングフレームワークである。本稿では,BiSSLのトレーニングアルゴリズムを提案する。提案手法は,12の下流画像分類データセットの大部分とオブジェクト検出の精度を大幅に向上させる。
論文参考訳（メタデータ） (2024-10-03T11:07:43Z)
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Self-Regularization [77.62516752323207]
そこで本研究では,事前訓練した重みを効率よく微調整する直交微調整法を導入し,頑健さと一般化の強化を実現した。自己正規化戦略は、OrthSRと呼ばれるVLMのゼロショット一般化の観点から安定性を維持するためにさらに活用される。筆者らはCLIPとCoOpを再検討し,少数の画像のクラスフィシエーションシナリオにおけるモデルの改善を効果的に行う。
論文参考訳（メタデータ） (2024-07-11T10:35:53Z)
Co-training for Low Resource Scientific Natural Language Inference [65.37685198688538]
遠隔教師付きラベルに分類器のトレーニング力学に基づいて重みを割り当てる新しいコトレーニング手法を提案する。予測された信頼度に対する任意のしきい値に基づいてサンプルをフィルタリングするのではなく、重要重みを割り当てることにより、自動ラベル付きデータの使用を最大化する。提案手法は、遠隔監視ベースラインに対するマクロF1の1.5%の改善と、他の強力なSSLベースラインよりも大幅に改善されている。
論文参考訳（メタデータ） (2024-06-20T18:35:47Z)
Towards Continual Learning Desiderata via HSIC-Bottleneck Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文参考訳（メタデータ） (2024-01-17T09:01:29Z)
Stable Distillation: Regularizing Continued Pre-training for Low-Resource Automatic Speech Recognition [54.9235160379917]
安定蒸留はSSLベースの継続事前トレーニングのためのシンプルで斬新なアプローチである。これにより、ラベル付きデータとラベルなしデータの両方が制限されたターゲットドメインでのASRパフォーマンスが向上する。
論文参考訳（メタデータ） (2023-12-20T06:02:12Z)
Semi-Supervised Class-Agnostic Motion Prediction with Pseudo Label Regeneration and BEVMix [59.55173022987071]
クラス非依存動作予測のための半教師あり学習の可能性について検討する。我々のフレームワークは一貫性に基づく自己学習パラダイムを採用しており、ラベルのないデータからモデルを学習することができる。本手法は,弱さと完全教師付き手法に匹敵する性能を示す。
論文参考訳（メタデータ） (2023-12-13T09:32:50Z)
Progressive Feature Adjustment for Semi-supervised Learning from Pretrained Models [39.42802115580677]
半教師付き学習(SSL)はラベル付きデータとラベルなしデータの両方を利用して予測モデルを構築することができる。近年の文献では、事前訓練されたモデルで最先端のSSLを適用しても、トレーニングデータの潜在能力を最大限に発揮できないことが示唆されている。本稿では,ラベルの誤りに敏感でない特徴抽出器を更新するために,非ラベルデータから擬似ラベルを使用することを提案する。
論文参考訳（メタデータ） (2023-09-09T01:57:14Z)
In-Domain Self-Supervised Learning Improves Remote Sensing Image Scene Classification [5.323049242720532]
リモートセンシング画像分類のための有望なアプローチとして,自己教師付き学習が登場している。そこで本研究では,14の下流データセットにまたがる自己教師型事前学習戦略について検討し,その効果を評価する。
論文参考訳（メタデータ） (2023-07-04T10:57:52Z)
Efficient Gaussian Process Model on Class-Imbalanced Datasets for Generalized Zero-Shot Learning [37.00463358780726]
本稿では,潜在機能埋め込みを学習するニューラルネットワークモデルと,未確認クラスの潜在機能プロトタイプを予測するガウスプロセス(GP)回帰モデルを提案する。我々のモデルは、クラス不均衡なトレーニングデータの影響を緩和する単純なトレーニング戦略により、効率的に訓練される。
論文参考訳（メタデータ） (2022-10-11T04:57:20Z)
Improving Self-Supervised Learning by Characterizing Idealized Representations [155.1457170539049]
与えられたデータ拡張に不変なタスクに対して必要かつ十分な条件を証明します。対照的に、我々のフレームワークは、従来の手法に対して単純だが重要な改善を規定している。非コントラスト学習では、私たちのフレームワークを使って、シンプルで斬新な目的を導き出します。
論文参考訳（メタデータ） (2022-09-13T18:01:03Z)
Revisiting Pretraining for Semi-Supervised Learning in the Low-Label Regime [15.863530936691157]
半教師付き学習(SSL)は、擬似ラベル付けによって大きなラベル付きデータを活用することでラベル付きデータの欠如に対処する。近年の研究では、訓練済み重量の微調整(FT)をSSLと組み合わせて課題を緩和し、低ラベル体制においてより優れた結果を主張している。
論文参考訳（メタデータ） (2022-05-06T03:53:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。