Fugu-MT 論文翻訳(概要): Rethinking Counterfactual Data Augmentation Under Confounding

論文の概要: Rethinking Counterfactual Data Augmentation Under Confounding

arxiv url: http://arxiv.org/abs/2305.18183v1
Date: Mon, 29 May 2023 16:20:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-30 14:23:27.966107
Title: Rethinking Counterfactual Data Augmentation Under Confounding
Title（参考訳）: コンバウンディングによる対物的データ拡張の再考
Authors: Abbavaram Gowtham Reddy, Saketh Bachu, Saloni Dash, Charchit Sharma, Amit Sharma, Vineeth N Balasubramanian
Abstract要約: 機械学習モデルのトレーニングデータにおけるバイアスを緩和する手段として、ファクトファクトデータ拡張が登場している。提案手法は, 逆ファクト的データ拡張に基づいて, 合流バイアスが下流の分類器に与える影響を解析し, 解に対する因果的視点を示す。
参考スコア（独自算出の注目度）: 20.90693383644665
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Counterfactual data augmentation has recently emerged as a method to mitigate confounding biases in the training data for a machine learning model. These biases, such as spurious correlations, arise due to various observed and unobserved confounding variables in the data generation process. In this paper, we formally analyze how confounding biases impact downstream classifiers and present a causal viewpoint to the solutions based on counterfactual data augmentation. We explore how removing confounding biases serves as a means to learn invariant features, ultimately aiding in generalization beyond the observed data distribution. Additionally, we present a straightforward yet powerful algorithm for generating counterfactual images, which effectively mitigates the influence of confounding effects on downstream classifiers. Through experiments on MNIST variants and the CelebA datasets, we demonstrate the effectiveness and practicality of our approach.
Abstract（参考訳）: 機械学習モデルのトレーニングデータの偏りを緩和する方法として、反事実データ拡張が最近登場している。これらのバイアス、例えばスプリアス相関は、データ生成プロセスにおける様々な観測および観測されていない共起変数によって生じる。本稿では,提案手法が下流分類器にどのように影響するかを正式に分析し,反実データ拡張に基づく解に対する因果的視点を示す。共起バイアスの除去が不変な特徴を学習する手段としてどのように役立ち、最終的に観測されたデータ分布を超えた一般化を支援するかを検討する。さらに, 逆ファクト画像を生成するアルゴリズムを提案することで, 下流分類器に対する共起効果の影響を効果的に軽減する。 mnist変種とcelebaデータセットの実験を通じて,本手法の有効性と実用性を示す。

関連論文リスト

Boosting Model Resilience via Implicit Adversarial Data Augmentation [20.768174896574916]
本稿では, 対向性および対向性摂動分布を組み込むことにより, 試料の深い特性を増大させることを提案する。そして、この拡張過程が代理損失関数の最適化に近似することを理論的に明らかにする。我々は4つの共通のバイアス付き学習シナリオにまたがって広範な実験を行う。
論文参考訳（メタデータ） (2024-04-25T03:22:48Z)
Data Attribution for Diffusion Models: Timestep-induced Bias in Influence Estimation [53.27596811146316]
拡散モデルは、以前の文脈における瞬間的な入出力関係ではなく、一連のタイムステップで操作する。本稿では、この時間的ダイナミクスを取り入れた拡散トラクInについて、サンプルの損失勾配ノルムが時間ステップに大きく依存していることを確認する。そこで我々はDiffusion-ReTracを再正規化適応として導入し、興味のあるサンプルを対象にしたトレーニングサンプルの検索を可能にする。
論文参考訳（メタデータ） (2024-01-17T07:58:18Z)
Data augmentation and explainability for bias discovery and mitigation in deep learning [0.0]
この論文は、ディープニューラルネットワークにおけるバイアスの影響を調査し、モデルパフォーマンスへの影響を減らす方法を提案する。最初の部分は、データやモデルのバイアスやエラーの潜在的な原因を分類し、記述することから始まり、特に機械学習パイプラインのバイアスに焦点を当てている。次の章では、予測と制御を正当化し、モデルを改善する手段として、説明可能なAIの分類と方法について概説する。
論文参考訳（メタデータ） (2023-08-18T11:02:27Z)
Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文参考訳（メタデータ） (2023-04-26T10:36:40Z)
Is augmentation effective to improve prediction in imbalanced text datasets? [3.1690891866882236]
データ拡張なしでカットオフを調整することは、オーバーサンプリング手法と同じような結果をもたらすと我々は主張する。この結果は、不均衡なデータを扱うための様々なアプローチの長所と短所の理解に寄与する。
論文参考訳（メタデータ） (2023-04-20T13:07:31Z)
Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文参考訳（メタデータ） (2022-09-29T18:11:01Z)
Learning Bias-Invariant Representation by Cross-Sample Mutual Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文参考訳（メタデータ） (2021-08-11T21:17:02Z)
Hard-label Manifolds: Unexpected Advantages of Query Efficiency for Finding On-manifold Adversarial Examples [67.23103682776049]
画像分類モデルに対する最近のゼロオーダーのハードラベル攻撃は、ファーストオーダーのグラデーションレベルの代替品に匹敵する性能を示している。最近、グラデーションレベルの設定では、通常の敵対的な例がデータ多様体から離れ、オンマニホールドの例が実際には一般化エラーであることが示されている。雑音の多い多様体距離オラクルに基づく情報理論論的議論を提案し、敵の勾配推定を通じて多様体情報を漏洩させる。
論文参考訳（メタデータ） (2021-03-04T20:53:06Z)
Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文参考訳（メタデータ） (2021-02-09T20:28:35Z)
On Data Augmentation and Adversarial Risk: An Empirical Analysis [9.586672294115075]
我々は,異なるデータ拡張手法が敵のリスクに与える影響を3つの尺度で分析する。データ拡張による分類性能の向上は、常に敵攻撃によるリスクの改善を伴うという仮説を否定する。以上の結果から, 拡張されたデータは, 拡張されていないデータよりも, 結果のモデルに強い影響があることが判明した。
論文参考訳（メタデータ） (2020-07-06T11:16:18Z)
Provably Efficient Causal Reinforcement Learning with Confounded Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-06-22T14:49:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。