論文の概要: Rethinking Counterfactual Data Augmentation Under Confounding
- arxiv url: http://arxiv.org/abs/2305.18183v1
- Date: Mon, 29 May 2023 16:20:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 14:23:27.966107
- Title: Rethinking Counterfactual Data Augmentation Under Confounding
- Title(参考訳): コンバウンディングによる対物的データ拡張の再考
- Authors: Abbavaram Gowtham Reddy, Saketh Bachu, Saloni Dash, Charchit Sharma,
Amit Sharma, Vineeth N Balasubramanian
- Abstract要約: 機械学習モデルのトレーニングデータにおけるバイアスを緩和する手段として、ファクトファクトデータ拡張が登場している。
提案手法は, 逆ファクト的データ拡張に基づいて, 合流バイアスが下流の分類器に与える影響を解析し, 解に対する因果的視点を示す。
- 参考スコア(独自算出の注目度): 20.90693383644665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counterfactual data augmentation has recently emerged as a method to mitigate
confounding biases in the training data for a machine learning model. These
biases, such as spurious correlations, arise due to various observed and
unobserved confounding variables in the data generation process. In this paper,
we formally analyze how confounding biases impact downstream classifiers and
present a causal viewpoint to the solutions based on counterfactual data
augmentation. We explore how removing confounding biases serves as a means to
learn invariant features, ultimately aiding in generalization beyond the
observed data distribution. Additionally, we present a straightforward yet
powerful algorithm for generating counterfactual images, which effectively
mitigates the influence of confounding effects on downstream classifiers.
Through experiments on MNIST variants and the CelebA datasets, we demonstrate
the effectiveness and practicality of our approach.
- Abstract(参考訳): 機械学習モデルのトレーニングデータの偏りを緩和する方法として、反事実データ拡張が最近登場している。
これらのバイアス、例えばスプリアス相関は、データ生成プロセスにおける様々な観測および観測されていない共起変数によって生じる。
本稿では,提案手法が下流分類器にどのように影響するかを正式に分析し,反実データ拡張に基づく解に対する因果的視点を示す。
共起バイアスの除去が不変な特徴を学習する手段としてどのように役立ち、最終的に観測されたデータ分布を超えた一般化を支援するかを検討する。
さらに, 逆ファクト画像を生成するアルゴリズムを提案することで, 下流分類器に対する共起効果の影響を効果的に軽減する。
mnist変種とcelebaデータセットの実験を通じて,本手法の有効性と実用性を示す。
関連論文リスト
- Boosting Model Resilience via Implicit Adversarial Data Augmentation [20.768174896574916]
本稿では, 対向性および対向性摂動分布を組み込むことにより, 試料の深い特性を増大させることを提案する。
そして、この拡張過程が代理損失関数の最適化に近似することを理論的に明らかにする。
我々は4つの共通のバイアス付き学習シナリオにまたがって広範な実験を行う。
論文 参考訳(メタデータ) (2024-04-25T03:22:48Z) - Data Attribution for Diffusion Models: Timestep-induced Bias in Influence Estimation [53.27596811146316]
拡散モデルは、以前の文脈における瞬間的な入出力関係ではなく、一連のタイムステップで操作する。
本稿では、この時間的ダイナミクスを取り入れた拡散トラクInについて、サンプルの損失勾配ノルムが時間ステップに大きく依存していることを確認する。
そこで我々はDiffusion-ReTracを再正規化適応として導入し、興味のあるサンプルを対象にしたトレーニングサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2024-01-17T07:58:18Z) - Data augmentation and explainability for bias discovery and mitigation
in deep learning [0.0]
この論文は、ディープニューラルネットワークにおけるバイアスの影響を調査し、モデルパフォーマンスへの影響を減らす方法を提案する。
最初の部分は、データやモデルのバイアスやエラーの潜在的な原因を分類し、記述することから始まり、特に機械学習パイプラインのバイアスに焦点を当てている。
次の章では、予測と制御を正当化し、モデルを改善する手段として、説明可能なAIの分類と方法について概説する。
論文 参考訳(メタデータ) (2023-08-18T11:02:27Z) - Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文 参考訳(メタデータ) (2023-04-26T10:36:40Z) - Is augmentation effective to improve prediction in imbalanced text
datasets? [3.1690891866882236]
データ拡張なしでカットオフを調整することは、オーバーサンプリング手法と同じような結果をもたらすと我々は主張する。
この結果は、不均衡なデータを扱うための様々なアプローチの長所と短所の理解に寄与する。
論文 参考訳(メタデータ) (2023-04-20T13:07:31Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Hard-label Manifolds: Unexpected Advantages of Query Efficiency for
Finding On-manifold Adversarial Examples [67.23103682776049]
画像分類モデルに対する最近のゼロオーダーのハードラベル攻撃は、ファーストオーダーのグラデーションレベルの代替品に匹敵する性能を示している。
最近、グラデーションレベルの設定では、通常の敵対的な例がデータ多様体から離れ、オンマニホールドの例が実際には一般化エラーであることが示されている。
雑音の多い多様体距離オラクルに基づく情報理論論的議論を提案し、敵の勾配推定を通じて多様体情報を漏洩させる。
論文 参考訳(メタデータ) (2021-03-04T20:53:06Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - On Data Augmentation and Adversarial Risk: An Empirical Analysis [9.586672294115075]
我々は,異なるデータ拡張手法が敵のリスクに与える影響を3つの尺度で分析する。
データ拡張による分類性能の向上は、常に敵攻撃によるリスクの改善を伴うという仮説を否定する。
以上の結果から, 拡張されたデータは, 拡張されていないデータよりも, 結果のモデルに強い影響があることが判明した。
論文 参考訳(メタデータ) (2020-07-06T11:16:18Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。