論文の概要: Nuisances via Negativa: Adjusting for Spurious Correlations via Data Augmentation
- arxiv url: http://arxiv.org/abs/2210.01302v3
- Date: Wed, 3 Jul 2024 08:06:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 21:02:45.776128
- Title: Nuisances via Negativa: Adjusting for Spurious Correlations via Data Augmentation
- Title(参考訳): NegativaによるNuisances:データ拡張によるスパーラス相関の調整
- Authors: Aahlad Puli, Nitish Joshi, Yoav Wald, He He, Rajesh Ranganath,
- Abstract要約: ラベルとの関係の異なる特徴はニュアンスである。
ニュアンスとラベルの関係を利用するモデルは、これらの関係が変化するとパフォーマンスが低下する。
我々は,意味論に関する知識をデータに悪用して利用するためのアプローチを開発する。
- 参考スコア(独自算出の注目度): 32.66196135141696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In prediction tasks, there exist features that are related to the label in the same way across different settings for that task; these are semantic features or semantics. Features with varying relationships to the label are nuisances. For example, in detecting cows from natural images, the shape of the head is semantic but because images of cows often have grass backgrounds but not always, the background is a nuisance. Models that exploit nuisance-label relationships face performance degradation when these relationships change. Building models robust to such changes requires additional knowledge beyond samples of the features and labels. For example, existing work uses annotations of nuisances or assumes ERM-trained models depend on nuisances. Approaches to integrate new kinds of additional knowledge enlarge the settings where robust models can be built. We develop an approach to use knowledge about the semantics by corrupting them in data, and then using the corrupted data to produce models which identify correlations between nuisances and the label. Once these correlations are identified, they can be used to adjust for where nuisances drive predictions. We study semantic corruptions in powering different spurious-correlation avoiding methods on multiple out-of-distribution (OOD) tasks like classifying waterbirds, natural language inference (NLI), and detecting cardiomegaly in chest X-rays.
- Abstract(参考訳): 予測タスクには、そのタスクの異なる設定で同じ方法でラベルに関連する機能があります。
ラベルとの関係の異なる特徴はニュアンスである。
例えば、自然画像から牛を検出する場合、頭部の形状は意味があるが、牛の像は草の背景を持つことが多いため、背景は不快である。
ニュアンスとラベルの関係を利用するモデルは、これらの関係が変化するとパフォーマンスが低下する。
このような変更に対して堅牢なモデルを構築するには、機能やラベルのサンプル以上の知識が必要になる。
例えば、既存の研究ではニュアンセのアノテーションを使用しており、ERMで訓練されたモデルはニュアンセに依存していると仮定している。
新しい種類の追加知識を統合するアプローチは、堅牢なモデルの構築が可能な設定を拡大する。
本研究は,データ中の意味に関する知識を損なうことによって活用する手法を開発し,そのデータを用いてニュアンセとラベルの相関関係を同定するモデルを作成する。
これらの相関が特定されれば、ニュアンセが予測を行う場所の調整に使用できる。
本研究では,水鳥の分類,自然言語推論(NLI),胸部X線による心内膜検出など,複数のアウト・オブ・ディストリビューション(OOD)タスクにおいて,異なるスプリアス相関を回避するための意味的腐敗について検討した。
関連論文リスト
- Common-Sense Bias Discovery and Mitigation for Classification Tasks [16.8259488742528]
画像記述に基づいてデータセットの特徴クラスタを抽出するフレームワークを提案する。
解析された特徴と相関は人間に解釈可能であるので、我々はCommon-Sense Bias Discovery (CSBD) という手法を名づける。
実験の結果,2つのベンチマーク画像データセットに対して,複数の分類タスクに新たなバイアスが生じることがわかった。
論文 参考訳(メタデータ) (2024-01-24T03:56:07Z) - Improving Fairness using Vision-Language Driven Image Augmentation [60.428157003498995]
公平性は、特に顔領域において、ディープラーニングの識別モデルを訓練する際に重要である。
モデルは、特定の特性(年齢や肌の色など)と無関係な属性(下流タスク)を関連付ける傾向がある
本稿では,これらの相関を緩和し,公平性を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-11-02T19:51:10Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Causal Transportability for Visual Recognition [70.13627281087325]
画像とラベルの関連性は、設定間では転送できないため、標準分類器がフェールすることを示す。
次に、すべての共起源を摂食する因果効果が、ドメイン間で不変であることを示す。
これにより、画像分類における因果効果を推定するアルゴリズムを開発する動機付けとなる。
論文 参考訳(メタデータ) (2022-04-26T15:02:11Z) - Nuisance-Label Supervision: Robustness Improvement by Free Labels [14.711384503643995]
本稿では,Nuisance-label Supervision (NLS) モジュールを提案する。
実験では、画像の劣化に対する頑健さと行動認識の外観変化が一貫した改善を示す。
論文 参考訳(メタデータ) (2021-10-14T02:07:00Z) - Predictive Modeling in the Presence of Nuisance-Induced Spurious
Correlations [18.529899583515206]
分類タスクでは、ラベルといくつかのニュアンス変数の間の関係の変化によって、スプリアス相関が引き起こされる。
我々は、ニュアンスとラベルの関係でのみ異なる分布の族を定式化する。
私たちは強い刺激的な相関の下で肺炎を予測するモデルを作成します。
論文 参考訳(メタデータ) (2021-06-29T18:12:59Z) - Towards Robust Classification Model by Counterfactual and Invariant Data
Generation [7.488317734152585]
純粋さは、一部の特徴がラベルと相関するが因果関係がないときに起こる。
本稿では2つのデータ生成プロセスを提案する。
我々のデータ生成は、スプリアス相関が壊れたときの精度で最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-06-02T12:48:29Z) - Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles [66.15398165275926]
本稿では,データセット固有のパターンを自動的に検出・無視する手法を提案する。
我々の方法は、より高い容量モデルでアンサンブルで低容量モデルを訓練する。
視覚的質問応答データセットの10ポイントゲインを含む,すべての設定の改善を示す。
論文 参考訳(メタデータ) (2020-11-07T22:20:03Z) - Learning Causal Models Online [103.87959747047158]
予測モデルは、予測を行うためにデータの急激な相関に依存することができる。
強い一般化を達成するための一つの解決策は、モデルに因果構造を組み込むことである。
本稿では,突発的特徴を継続的に検出・除去するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T20:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。