Fugu-MT 論文翻訳(概要): Mind the Graph When Balancing Data for Fairness or Robustness

論文の概要: Mind the Graph When Balancing Data for Fairness or Robustness

arxiv url: http://arxiv.org/abs/2406.17433v1
Date: Tue, 25 Jun 2024 10:16:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-26 14:51:57.499919
Title: Mind the Graph When Balancing Data for Fairness or Robustness
Title（参考訳）: 公正さとロバストさのためのデータバランシングにおけるグラフの考え方
Authors: Jessica Schrouff, Alexis Bellot, Amal Rannen-Triki, Alan Malek, Isabela Albuquerque, Arthur Gretton, Alexander D'Amour, Silvia Chiappa,
Abstract要約: データバランシングのためのトレーニングディストリビューションの条件を定義し、公正またはロバストなモデルに導く。その結果、多くの場合、バランスの取れた分布は、望ましくない依存関係を選択的に除去することには対応しないことがわかった。その結果,データバランシングを行う前に因果グラフを考慮に入れることの重要性を強調した。
参考スコア（独自算出の注目度）: 73.03155969727038
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Failures of fairness or robustness in machine learning predictive settings can be due to undesired dependencies between covariates, outcomes and auxiliary factors of variation. A common strategy to mitigate these failures is data balancing, which attempts to remove those undesired dependencies. In this work, we define conditions on the training distribution for data balancing to lead to fair or robust models. Our results display that, in many cases, the balanced distribution does not correspond to selectively removing the undesired dependencies in a causal graph of the task, leading to multiple failure modes and even interference with other mitigation techniques such as regularization. Overall, our results highlight the importance of taking the causal graph into account before performing data balancing.
Abstract（参考訳）: 機械学習の予測設定におけるフェアネスやロバストネスの失敗は、共変量、結果、変動の補助要因の間の望ましくない依存関係に起因する可能性がある。これらの障害を軽減するための一般的な戦略はデータバランシングである。本研究では、データバランスのトレーニング分布に関する条件を定義し、公正なモデルやロバストなモデルに導く。以上の結果から,バランスの取れた分布は,タスクの因果グラフにおいて不要な依存関係を選択的に除去することには対応せず,複数の障害モードを発生させ,また正規化などの他の緩和手法との干渉さえも生じないことが明らかとなった。その結果,データバランシングを行う前に因果グラフを考慮に入れることの重要性を強調した。

関連論文リスト

Causal Graph Learning via Distributional Invariance of Cause-Effect Relationship [54.575090553659074]
本研究では,観測変数数の2次複雑性と因果関係を効率的に発見するアルゴリズムを開発した。大規模データセットの様々なベンチマークによる実験は、既存の研究よりも優れた、あるいは同等な性能を示している。
論文参考訳（メタデータ） (2026-02-03T10:26:16Z)
A Distributionally-Robust Framework for Nuisance in Causal Effect Estimation [1.3053649021965603]
因果推論では、治療群と対照群の間のバランスの取れた分布のモデルを評価する必要がある。最も一般的な統計手法は、逆確率重み付け(IPW)によるこの分布シフトに対処するものである。誤差一般化を分解してこれらの問題 - 正当性あいまいさと統計的不安定さ - を分離し, 対向損失関数を通して対処する。
論文参考訳（メタデータ） (2025-05-23T10:34:28Z)
Rethinking the Bias of Foundation Model under Long-tailed Distribution [18.80942166783087]
下流タスクの基盤モデルで継承される不均衡バイアスはパラメータ不均衡とデータ不均衡である。微調整中、パラメータの不均衡がより重要な役割を果たすのに対し、データ不均衡は既存の再バランス戦略によって緩和される。本稿では,入力サンプルとラベル間の真の因果関係を学習する新しいバックドア調整手法を提案する。
論文参考訳（メタデータ） (2025-01-27T11:00:19Z)
Towards Robust Text Classification: Mitigating Spurious Correlations with Causal Learning [2.7813683000222653]
本稿では,因果関係へのモデル依存を軽減するために,因果相関ロバスト (CCR) を提案する。 CCRは、逆確率重み付け(IPW)損失関数とともに、反ファクト推論に基づく因果的特徴選択法を統合する。グループラベルを持たないメソッド間でのCCRの最先端性能を示し、場合によってはグループラベルを利用するモデルと競合する。
論文参考訳（メタデータ） (2024-11-01T21:29:07Z)
The Data Addition Dilemma [4.869513274920574]
医療タスクのための多くの機械学習では、標準データセットは、多くの、基本的に異なるソースにまたがるデータを集約することによって構築される。しかし、いつより多くのデータを追加することが助けになるのか、いつ、実際の設定で望ましいモデル結果の進行を妨げるのか? この状況をtextitData Addition Dilemma と認識し、このマルチソーススケーリングコンテキストにトレーニングデータを追加すると、全体的な精度が低下し、不確実なフェアネスの結果が減少し、最悪のサブグループのパフォーマンスが低下することを示した。
論文参考訳（メタデータ） (2024-08-08T01:42:31Z)
Non-Asymptotic Performance of Social Machine Learning Under Limited Data [45.48644055449902]
本稿では,社会機械学習フレームワークに関連付けられた誤りの確率について検討する。これは、ラベルのないデータのストリームを分散的に分類する問題に対処する。
論文参考訳（メタデータ） (2023-06-15T17:42:14Z)
Distributionally Robust Semi-Supervised Learning Over Graphs [68.29280230284712]
グラフ構造化データに対する半教師付き学習(SSL)は、多くのネットワークサイエンスアプリケーションに現れる。グラフ上の学習を効率的に管理するために,近年,グラフニューラルネットワーク(GNN)の変種が開発されている。実際に成功したにも拘わらず、既存の手法のほとんどは、不確実な結節属性を持つグラフを扱うことができない。ノイズ測定によって得られたデータに関連する分布の不確実性によっても問題が発生する。分散ロバストな学習フレームワークを開発し,摂動に対する定量的ロバスト性を示すモデルを訓練する。
論文参考訳（メタデータ） (2021-10-20T14:23:54Z)
Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文参考訳（メタデータ） (2021-06-14T05:39:09Z)
BayesIMP: Uncertainty Quantification for Causal Data Fusion [52.184885680729224]
本研究では,複数の因果グラフに関連するデータセットを組み合わせ,対象変数の平均処理効果を推定する因果データ融合問題について検討する。本稿では、確率積分とカーネル平均埋め込みのアイデアを組み合わせて、再生されたカーネルヒルベルト空間における干渉分布を表現するフレームワークを提案する。
論文参考訳（メタデータ） (2021-06-07T10:14:18Z)
Counterfactual Representation Learning with Balancing Weights [74.67296491574318]
観察データによる因果推論の鍵は、それぞれの治療タイプに関連する予測的特徴のバランスを達成することである。近年の文献では、この目標を達成するために表現学習を探求している。因果効果を柔軟かつスケーラブルかつ正確に推定するアルゴリズムを開発した。
論文参考訳（メタデータ） (2020-10-23T19:06:03Z)
Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文参考訳（メタデータ） (2020-07-21T08:18:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。