論文の概要: Predictive Modeling in the Presence of Nuisance-Induced Spurious
Correlations
- arxiv url: http://arxiv.org/abs/2107.00520v1
- Date: Tue, 29 Jun 2021 18:12:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-02 13:58:04.007448
- Title: Predictive Modeling in the Presence of Nuisance-Induced Spurious
Correlations
- Title(参考訳): ニュアサンス誘発スプリアス相関の存在下での予測モデル
- Authors: Aahlad Puli, Lily H. Zhang, Eric K. Oermann, Rajesh Ranganath
- Abstract要約: 分類タスクでは、ラベルといくつかのニュアンス変数の間の関係の変化によって、スプリアス相関が引き起こされる。
我々は、ニュアンスとラベルの関係でのみ異なる分布の族を定式化する。
私たちは強い刺激的な相関の下で肺炎を予測するモデルを作成します。
- 参考スコア(独自算出の注目度): 18.529899583515206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep predictive models often make use of spurious correlations between the
label and the covariates that differ between training and test distributions.
In many classification tasks, spurious correlations are induced by a changing
relationship between the label and some nuisance variables correlated with the
covariates. For example, in classifying animals in natural images, the
background, which is the nuisance, can predict the type of animal, but this
nuisance label relationship does not always hold. This nuisance-label
relationship does not always hold. We formalize a family of distributions that
only differ in the nuisance-label relationship and and introduce a distribution
where this relationship is broken called the nuisance-randomized distribution.
We introduce a set of predictive models built from the nuisance-randomized
distribution with representations, that when conditioned on, do not correlate
the label and the nuisance. For models in this set, we lower bound the
performance for any member of the family with the mutual information between
the representation and the label under the nuisance-randomized distribution. To
build predictive models that maximize the performance lower bound, we develop
Nuisance-Randomized Distillation (NURD). We evaluate NURD on a synthetic
example, colored-MNIST, and classifying chest X-rays. When using non-lung
patches as the nuisance in classifying chest X-rays, NURD produces models that
predict pneumonia under strong spurious correlations.
- Abstract(参考訳): 深い予測モデルは、しばしば、トレーニングとテストの分布で異なるラベルと共変量の間の急激な相関を利用する。
多くの分類タスクにおいて、スプリアス相関はラベルと共変量と相関するいくつかのニュアンス変数の間の変化によって引き起こされる。
例えば、自然画像で動物を分類する場合、迷惑である背景は動物の種類を予測することができるが、この迷惑ラベル関係は常に保持されるとは限らない。
このニュアンスとラベルの関係は必ずしも成り立たない。
我々は、ニュアンス-ラベル関係にのみ異なる分布の族を定式化し、ニュアンス-ランダム分布と呼ばれるこの関係が壊れた分布を導入する。
本稿では, ニュアサンスランダム分布と表現から構築した予測モデルについて, 条件づけされた場合, ラベルとニュアザンスとの相関性がないことを示す。
このセットのモデルでは、表現とラベルの間の相互情報を持つ家族の任意のメンバーのパフォーマンスを、ニュアンス・ランダム化分布の下で低くする。
性能低下を最大化する予測モデルを構築するため,Nuisance-Randomized Distillation (NURD) を開発した。
合成例, カラーMNIST, 胸部X線分類によるNURDの評価を行った。
胸部x線分類に非lungパッチを使用する場合、nurdは強いスプリアス相関の下で肺炎を予測するモデルを生成する。
関連論文リスト
- Learning Robust Classifiers with Self-Guided Spurious Correlation Mitigation [26.544938760265136]
ディープニューラル分類器は、入力のスプリアス属性とターゲットの間のスプリアス相関に頼り、予測を行う。
本稿では,自己誘導型スプリアス相関緩和フレームワークを提案する。
予測行動の違いを識別するために分類器の訓練を行うことで,事前知識を必要とせず,素因関係への依存を軽減できることを示す。
論文 参考訳(メタデータ) (2024-05-06T17:12:21Z) - A Note on the Convergence of Denoising Diffusion Probabilistic Models [3.75292409381511]
拡散モデルにより得られたデータ生成分布と分布との間のワッサーシュタイン距離の定量的上限を導出する。
この分野でのこれまでの研究とは異なり、我々の結果は学習したスコア関数を仮定しない。
論文 参考訳(メタデータ) (2023-12-10T20:29:58Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Even Small Correlation and Diversity Shifts Pose Dataset-Bias Issues [19.4921353136871]
実験サンプルがトレーニング中に見つからないパターンを示す場合の多様性シフトと、テストデータが観察された不変性と急激な特徴の異なる相関を示す場合の相関シフトの2種類について検討した。
そこで我々は,両タイプのシフトをデータセットを用いて分析し,制御可能な方法で共存する統合プロトコルを提案する。
論文 参考訳(メタデータ) (2023-05-09T23:40:23Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Nuisances via Negativa: Adjusting for Spurious Correlations via Data Augmentation [32.66196135141696]
ラベルとの関係の異なる特徴はニュアンスである。
ニュアンスとラベルの関係を利用するモデルは、これらの関係が変化するとパフォーマンスが低下する。
我々は,意味論に関する知識をデータに悪用して利用するためのアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-04T01:40:31Z) - Adversarial Robustness through the Lens of Causality [105.51753064807014]
ディープニューラルネットワークの敵対的脆弱性は、機械学習において大きな注目を集めている。
我々は、因果関係を敵対的脆弱性の軽減に組み込むことを提案する。
我々の手法は、敵の脆弱性を緩和するために因果性を利用する最初の試みと見なすことができる。
論文 参考訳(メタデータ) (2021-06-11T06:55:02Z) - Towards Robust Classification Model by Counterfactual and Invariant Data
Generation [7.488317734152585]
純粋さは、一部の特徴がラベルと相関するが因果関係がないときに起こる。
本稿では2つのデータ生成プロセスを提案する。
我々のデータ生成は、スプリアス相関が壊れたときの精度で最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-06-02T12:48:29Z) - When Hearst Is not Enough: Improving Hypernymy Detection from Corpus
with Distributional Models [59.46552488974247]
本稿では,大きなテキストコーパスの助けを借りて,単語 (x, y) 間のis-a関係が存在するかどうかを論じる。
近年の研究では、大規模なハーストペアを抽出して給餌し、目に見えない(x, y)ペアの親和性が緩和された場合、パターンベースのペアの方が優れていることが示唆されている。
本稿では,これらの特定の事例の非無視的存在を初めて定量化し,その場合の分布法がパターンベースの事例を補うのに最適であることを示す。
論文 参考訳(メタデータ) (2020-10-10T08:34:19Z) - On the Discrepancy between Density Estimation and Sequence Generation [92.70116082182076]
log-likelihoodは、同じファミリー内のモデルを考えるとき、BLEUと非常に相関している。
異なる家族間でのモデルランキングの相関はみられない。
論文 参考訳(メタデータ) (2020-02-17T20:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。