論文の概要: How robust are pre-trained models to distribution shift?
- arxiv url: http://arxiv.org/abs/2206.08871v1
- Date: Fri, 17 Jun 2022 16:18:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-20 13:29:49.839278
- Title: How robust are pre-trained models to distribution shift?
- Title(参考訳): 分散シフトに対する事前学習モデルの堅牢性は?
- Authors: Yuge Shi, Imant Daunhawer, Julia E. Vogt, Philip H.S. Torr, Amartya
Sanyal
- Abstract要約: 自己教師付き学習(SSL)と自己エンコーダベースモデル(AE)の相互関係が相互関係に与える影響を示す。
本研究では, 線形ヘッドの潜在バイアスから事前学習したモデルの性能を分離するために, アウト・オブ・ディストリビューション(OOD)データに基づいて訓練された線形ヘッドを用いた新しい評価手法を開発した。
- 参考スコア(独自算出の注目度): 82.08946007821184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The vulnerability of machine learning models to spurious correlations has
mostly been discussed in the context of supervised learning (SL). However,
there is a lack of insight on how spurious correlations affect the performance
of popular self-supervised learning (SSL) and auto-encoder based models (AE).
In this work, we shed light on this by evaluating the performance of these
models on both real world and synthetic distribution shift datasets. Following
observations that the linear head itself can be susceptible to spurious
correlations, we develop a novel evaluation scheme with the linear head trained
on out-of-distribution (OOD) data, to isolate the performance of the
pre-trained models from a potential bias of the linear head used for
evaluation. With this new methodology, we show that SSL models are consistently
more robust to distribution shifts and thus better at OOD generalisation than
AE and SL models.
- Abstract(参考訳): 機械学習モデルの突発的相関に対する脆弱性は、主に教師付き学習(SL)の文脈で議論されている。
しかし、この相関関係が一般的な自己教師付き学習(SSL)と自動エンコーダベースモデル(AE)のパフォーマンスにどのように影響するかについての知見は乏しい。
本研究では,実世界と合成分布シフトデータセットの両方において,これらのモデルの性能を評価することにより,この点に光を当てた。
線形ヘッド自体がスプリアス相関の影響を受けやすいという観測を受けて,od(out-of-distribution)データにトレーニングされたリニアヘッドを用いた新しい評価手法を開発し,評価に用いるリニアヘッドの潜在的なバイアスから事前学習したモデルの性能を分離する。
新たな手法により、SSLモデルはAEモデルやSLモデルよりも分散シフトに対して一貫して堅牢であり、OODの一般化が優れていることを示す。
関連論文リスト
- Revisiting Spurious Correlation in Domain Generalization [12.745076668687748]
データ生成プロセスにおける因果関係を記述するために,構造因果モデル(SCM)を構築した。
さらに、スプリアス相関に基づくメカニズムを徹底的に分析する。
そこで本研究では,OOD一般化における共起バイアスの制御について,相対性スコア重み付き推定器を導入して提案する。
論文 参考訳(メタデータ) (2024-06-17T13:22:00Z) - Low-rank finetuning for LLMs: A fairness perspective [54.13240282850982]
低ランク近似技術は、微調整された大規模言語モデルのデファクトスタンダードとなっている。
本稿では,これらの手法が初期訓練済みデータ分布から微調整データセットのシフトを捉える上での有効性について検討する。
低ランク微調整は好ましくない偏見や有害な振る舞いを必然的に保存することを示す。
論文 参考訳(メタデータ) (2024-05-28T20:43:53Z) - Evaluating Fairness in Self-supervised and Supervised Models for
Sequential Data [10.626503137418636]
自己教師型学習(SSL)は,大規模モデルのデファクトトレーニングパラダイムとなっている。
本研究では,事前学習と微調整が公正性に及ぼす影響について検討する。
論文 参考訳(メタデータ) (2024-01-03T09:31:43Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Guide the Learner: Controlling Product of Experts Debiasing Method Based
on Token Attribution Similarities [17.082695183953486]
一般的な回避策は、二次バイアスモデルに基づいてトレーニング例を再重み付けすることで、堅牢なモデルをトレーニングすることである。
ここでは、バイアスドモデルが機能をショートカットする、という前提がある。
本稿では,主要モデルと偏りのあるモデル属性スコアの類似性を,プロダクト・オブ・エキスパートズ・ロス関数に組み込んだ微調整戦略を提案する。
論文 参考訳(メタデータ) (2023-02-06T15:21:41Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Using Explainable Boosting Machine to Compare Idiographic and Nomothetic
Approaches for Ecological Momentary Assessment Data [2.0824228840987447]
本稿では,非線形解釈型機械学習(ML)モデルを用いた分類問題について検討する。
木々の様々なアンサンブルは、不均衡な合成データセットと実世界のデータセットを用いて線形モデルと比較される。
2つの実世界のデータセットのうちの1つで、知識蒸留法は改善されたAUCスコアを達成する。
論文 参考訳(メタデータ) (2022-04-04T17:56:37Z) - Influence Tuning: Demoting Spurious Correlations via Instance
Attribution and Instance-Driven Updates [26.527311287924995]
インフルエンスチューニングは、データの急激なパターンからモデルを分解するのに役立ちます。
制御された設定では、インフルエンスチューニングは、データの急激なパターンからモデルを分解するのに役立ちます。
論文 参考訳(メタデータ) (2021-10-07T06:59:46Z) - Self-Damaging Contrastive Learning [92.34124578823977]
ラベルのないデータは一般に不均衡であり、長い尾の分布を示す。
本稿では,クラスを知らずに表現学習を自動的にバランスをとるための,自己学習コントラスト学習という原則的枠組みを提案する。
実験の結果,SDCLRは全体としての精度だけでなく,バランス性も著しく向上することがわかった。
論文 参考訳(メタデータ) (2021-06-06T00:04:49Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。