論文の概要: Fairness in Missing Data Imputation
- arxiv url: http://arxiv.org/abs/2110.12002v1
- Date: Fri, 22 Oct 2021 18:29:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 15:14:50.989010
- Title: Fairness in Missing Data Imputation
- Title(参考訳): 欠落データ計算の公正性
- Authors: Yiliang Zhang, Qi Long
- Abstract要約: 我々は、欠落したデータ計算の公正性に関する最初の既知の研究を行う。
一般に使用されている3つのデータセットにおけるインパルス化手法の性能について検討することにより、欠落した値のインパルス化の不公平さが広く存在することを示す。
以上の結果から,実際に関連する要因を慎重に調査することで,不当なデータ計算による不公平を軽減できる可能性が示唆された。
- 参考スコア(独自算出の注目度): 2.3605348648054463
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Missing data are ubiquitous in the era of big data and, if inadequately
handled, are known to lead to biased findings and have deleterious impact on
data-driven decision makings. To mitigate its impact, many missing value
imputation methods have been developed. However, the fairness of these
imputation methods across sensitive groups has not been studied. In this paper,
we conduct the first known research on fairness of missing data imputation. By
studying the performance of imputation methods in three commonly used datasets,
we demonstrate that unfairness of missing value imputation widely exists and
may be associated with multiple factors. Our results suggest that, in practice,
a careful investigation of related factors can provide valuable insights on
mitigating unfairness associated with missing data imputation.
- Abstract(参考訳): 欠落したデータはビッグデータの時代はユビキタスであり、不適切に処理された場合、偏見のある発見につながることが知られ、データ駆動意思決定に有害な影響を及ぼす。
影響を軽減するために、多くの値計算方法が開発されている。
しかし、これらの計算手法がセンシティブなグループにまたがる公平性は研究されていない。
本稿では,データインプテーションの公正性に関する最初の既知の研究を行う。
一般に使用される3つのデータセットにおけるインプテーション法の性能を調べることにより,価値の欠落インプテーションの不公平性が広く存在し,複数の要因に関連付けられることを実証する。
以上の結果から,データインプテーションの欠如に伴う不公平さを緩和する上で,関連因子の慎重な調査が有用であることが示唆された。
関連論文リスト
- Is it Still Fair? A Comparative Evaluation of Fairness Algorithms through the Lens of Covariate Drift [17.498879317113385]
データ分散ドリフトとその公正度アルゴリズムとメトリクスへの影響について検討する。
場合によっては、データ分布のドリフトは、いわゆるフェアモデルにおいて、フェアネスの深刻な劣化を引き起こすことがある。
本研究の成果から,データ分散ドリフトが公正性アルゴリズムにもたらすいくつかの政策的含意を合成する。
論文 参考訳(メタデータ) (2024-09-19T03:18:12Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - Too Good To Be True: performance overestimation in (re)current practices
for Human Activity Recognition [49.1574468325115]
データセグメンテーションのためのスライディングウィンドウと、標準のランダムk倍のクロスバリデーションが続くと、バイアスのある結果が得られる。
この問題に対する科学界の認識を高めることは重要であり、その否定的な影響は見落とされつつある。
異なるタイプのデータセットと異なるタイプの分類モデルを用いたいくつかの実験により、問題を示し、メソッドやデータセットとは独立して持続することを示すことができる。
論文 参考訳(メタデータ) (2023-10-18T13:24:05Z) - Impact Of Missing Data Imputation On The Fairness And Accuracy Of Graph
Node Classifiers [0.19573380763700707]
グラフデータ(ノード属性)インプットの文脈における公平性への影響を,埋め込みとニューラルネットワークの異なる手法を用いて解析する。
この結果から,グラフデータの公平性や,グラフの欠落を効率的に処理する方法について,貴重な知見が得られる。
論文 参考訳(メタデータ) (2022-11-01T23:16:36Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Multistage Large Segment Imputation Framework Based on Deep Learning and
Statistic Metrics [8.266097781813656]
本研究では, 深層学習に基づく多段階計算フレームワークを提案する。
本モデルでは,データ分布の低次および高次統計量の混合測定指標と,データ計算性能指標の新たな視点を示す。
実験結果から, 多段階計算法と混合指標が優れていること, 不足値計算の効果がある程度改善されていることが明らかとなった。
論文 参考訳(メタデータ) (2022-09-22T14:17:24Z) - Valid Inference After Causal Discovery [73.87055989355737]
我々は、因果関係発見後の推論に有効なツールを開発する。
因果発見とその後の推論アルゴリズムの組み合わせは,高度に膨らんだ誤発見率をもたらすことを示す。
論文 参考訳(メタデータ) (2022-08-11T17:40:45Z) - To Impute or not to Impute? -- Missing Data in Treatment Effect
Estimation [84.76186111434818]
我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。
本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。
私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数をインプットすべきで、どの変数をインプットすべきでないかを正確に知らせる。
論文 参考訳(メタデータ) (2022-02-04T12:08:31Z) - LARD: Large-scale Artificial Disfluency Generation [0.0]
複雑で現実的な人工的不一致を少ない労力で生成する手法である LARD を提案する。
提案手法は, 繰り返し, 置換, 再起動の3種類の相反を処理できる。
4つの異なるタスクで使用できる、分散を持つ新しい大規模データセットをリリースする。
論文 参考訳(メタデータ) (2022-01-13T16:02:36Z) - Predicting feature imputability in the absence of ground truth [2.7684432804249477]
実生活の応用において、データが正確にインプットされたかどうか(真実の欠如)を評価することは困難である。
本稿では,個々のデータの特徴を正確に説明できるかどうかを判断するための,効果的でシンプルな主成分ベース手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T14:24:07Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。