論文の概要: Nuisances via Negativa: Adjusting for Spurious Correlations via Data
Augmentation
- arxiv url: http://arxiv.org/abs/2210.01302v1
- Date: Tue, 4 Oct 2022 01:40:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 13:40:44.762522
- Title: Nuisances via Negativa: Adjusting for Spurious Correlations via Data
Augmentation
- Title(参考訳): NegativaによるNuisances:データ拡張による純粋相関の調整
- Authors: Aahlad Puli, Nitish Joshi, He He and Rajesh Ranganath
- Abstract要約: ラベルとの関係の異なる特徴はニュアンスである。
ニュアンスとラベルの関係は設定によって不安定である。
データ拡張によるロバストモデル生成のための代替手法を開発する。
- 参考スコア(独自算出の注目度): 25.91327982352673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There exist features that are related to the label in the same way across
different settings for that task; these are semantic features or semantics.
Features with varying relationships to the label are nuisances. For example, in
detecting cows from natural images, the shape of the head is a semantic and
because images of cows often have grass backgrounds but only in certain
settings, the background is a nuisance. Relationships between a nuisance and
the label are unstable across settings and, consequently, models that exploit
nuisance-label relationships face performance degradation when these
relationships change. Direct knowledge of a nuisance helps build models that
are robust to such changes, but knowledge of a nuisance requires extra
annotations beyond the label and the covariates. In this paper, we develop an
alternative way to produce robust models by data augmentation. These data
augmentations corrupt semantic information to produce models that identify and
adjust for where nuisances drive predictions. We study semantic corruptions in
powering different robust-modeling methods for multiple out-of distribution
(OOD) tasks like classifying waterbirds, natural language inference, and
detecting Cardiomegaly in chest X-rays.
- Abstract(参考訳): そのタスクのさまざまな設定で同じようにラベルに関連付けられた機能があります。
ラベルと異なる関係を持つ特徴は迷惑である。
例えば、自然画像から牛を検出する場合、頭の形は意味的であり、牛の像は草の背景を持つことが多いが、特定の設定でのみ、背景は迷惑である。
ニュアンスとラベルの関係は設定によって不安定であり、その結果、ニュアンスとラベルの関係を利用するモデルでは、これらの関係が変化すると性能が低下する。
ニュアンスの直接的な知識は、そのような変化に対して堅牢なモデルを構築するのに役立つが、ニュアンスの知識はラベルと共変体以外の追加アノテーションを必要とする。
本稿では,データ拡張によるロバストモデル生成のための代替手法を開発する。
これらのデータは、腐敗したセマンティック情報を拡張し、ニュアンセが予測する場所を特定し調整するモデルを生成する。
本研究では,水鳥の分類,自然言語推論,胸部x線写真における心電図の検出など,複数のout-of distribution(ood)タスクに対して異なるロバストモデリング手法を駆動する意味的腐敗について検討した。
関連論文リスト
- Common-Sense Bias Discovery and Mitigation for Classification Tasks [16.8259488742528]
画像記述に基づいてデータセットの特徴クラスタを抽出するフレームワークを提案する。
解析された特徴と相関は人間に解釈可能であるので、我々はCommon-Sense Bias Discovery (CSBD) という手法を名づける。
実験の結果,2つのベンチマーク画像データセットに対して,複数の分類タスクに新たなバイアスが生じることがわかった。
論文 参考訳(メタデータ) (2024-01-24T03:56:07Z) - Improving Fairness using Vision-Language Driven Image Augmentation [60.428157003498995]
公平性は、特に顔領域において、ディープラーニングの識別モデルを訓練する際に重要である。
モデルは、特定の特性(年齢や肌の色など)と無関係な属性(下流タスク)を関連付ける傾向がある
本稿では,これらの相関を緩和し,公平性を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-11-02T19:51:10Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Posterior Collapse and Latent Variable Non-identifiability [54.842098835445]
柔軟性を犠牲にすることなく識別性を強制する深層生成モデルである,潜時同定可能な変分オートエンコーダのクラスを提案する。
合成および実データ全体にわたって、潜在識別可能な変分オートエンコーダは、後方崩壊を緩和し、データの有意義な表現を提供する既存の方法より優れている。
論文 参考訳(メタデータ) (2023-01-02T06:16:56Z) - PatchMix Augmentation to Identify Causal Features in Few-shot Learning [55.64873998196191]
少ないショット学習は、十分なカテゴリをラベル付けしたデータに基づいて学習した知識を、少ない既知の情報を持つ新しいカテゴリに転送することを目的としている。
我々はPatchMixと呼ばれる新しいデータ拡張戦略を提案し、この急激な依存関係を壊すことができる。
このような拡張メカニズムが,既存のメカニズムと異なり,因果的特徴を識別可能であることを示す。
論文 参考訳(メタデータ) (2022-11-29T08:41:29Z) - Uninformative Input Features and Counterfactual Invariance: Two
Perspectives on Spurious Correlations in Natural Language [19.416033815407804]
Spurious correlations is a threat to the trustworthiness of natural language processing systems。
本稿では,PCFGにおける特徴ラベル相関を生じさせる3つの異なる条件を解析する。
入力特徴はラベルと非常に稀な状況において個別に相関するので、真の堅牢性を脅かす刺激的な相関を識別するためにドメイン知識を適用する必要がある。
論文 参考訳(メタデータ) (2022-04-09T14:46:39Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Nuisance-Label Supervision: Robustness Improvement by Free Labels [14.711384503643995]
本稿では,Nuisance-label Supervision (NLS) モジュールを提案する。
実験では、画像の劣化に対する頑健さと行動認識の外観変化が一貫した改善を示す。
論文 参考訳(メタデータ) (2021-10-14T02:07:00Z) - Predictive Modeling in the Presence of Nuisance-Induced Spurious
Correlations [18.529899583515206]
分類タスクでは、ラベルといくつかのニュアンス変数の間の関係の変化によって、スプリアス相関が引き起こされる。
我々は、ニュアンスとラベルの関係でのみ異なる分布の族を定式化する。
私たちは強い刺激的な相関の下で肺炎を予測するモデルを作成します。
論文 参考訳(メタデータ) (2021-06-29T18:12:59Z) - Towards Robust Classification Model by Counterfactual and Invariant Data
Generation [7.488317734152585]
純粋さは、一部の特徴がラベルと相関するが因果関係がないときに起こる。
本稿では2つのデータ生成プロセスを提案する。
我々のデータ生成は、スプリアス相関が壊れたときの精度で最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-06-02T12:48:29Z) - Learning Causal Models Online [103.87959747047158]
予測モデルは、予測を行うためにデータの急激な相関に依存することができる。
強い一般化を達成するための一つの解決策は、モデルに因果構造を組み込むことである。
本稿では,突発的特徴を継続的に検出・除去するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T20:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。