論文の概要: Domain Adaptive Decision Trees: Implications for Accuracy and Fairness
- arxiv url: http://arxiv.org/abs/2302.13846v2
- Date: Wed, 31 May 2023 08:52:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 03:00:02.068222
- Title: Domain Adaptive Decision Trees: Implications for Accuracy and Fairness
- Title(参考訳): ドメイン適応決定木:正確性と公平性の意味
- Authors: Jose M. Alvarez, Kristen M. Scott, Salvatore Ruggieri, Bettina Berendt
- Abstract要約: 本稿ではドメイン適応決定木(DADT)を導入してドメイン適応の分野に貢献する。
DADTは、目標人口の分布に対応する外部情報に基づいて、情報ゲイン分割基準を調整する。
実データ上でDADTを実証し、シフトしたターゲット集団でテストする場合、標準決定木よりも精度が向上することを示す。
- 参考スコア(独自算出の注目度): 28.37613618406726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In uses of pre-trained machine learning models, it is a known issue that the
target population in which the model is being deployed may not have been
reflected in the source population with which the model was trained. This can
result in a biased model when deployed, leading to a reduction in model
performance. One risk is that, as the population changes, certain demographic
groups will be under-served or otherwise disadvantaged by the model, even as
they become more represented in the target population. The field of domain
adaptation proposes techniques for a situation where label data for the target
population does not exist, but some information about the target distribution
does exist. In this paper we contribute to the domain adaptation literature by
introducing domain-adaptive decision trees (DADT). We focus on decision trees
given their growing popularity due to their interpretability and performance
relative to other more complex models. With DADT we aim to improve the accuracy
of models trained in a source domain (or training data) that differs from the
target domain (or test data). We propose an in-processing step that adjusts the
information gain split criterion with outside information corresponding to the
distribution of the target population. We demonstrate DADT on real data and
find that it improves accuracy over a standard decision tree when testing in a
shifted target population. We also study the change in fairness under
demographic parity and equal opportunity. Results show an improvement in
fairness with the use of DADT.
- Abstract(参考訳): 事前訓練された機械学習モデルでは、モデルが展開されているターゲット人口が、モデルが訓練されたソース人口に反映されていない可能性があることが知られている。
これにより、デプロイ時にバイアスドモデルが発生し、モデルパフォーマンスが低下する可能性がある。
一つのリスクは、人口が変化するにつれて、特定の人口集団は、ターゲット人口に代表されるようになってきたとしても、そのモデルによって過小評価されるか、あるいは不利になってしまうことである。
ドメイン適応の分野は,対象人口のラベルデータが存在しない状況において,対象分布に関する情報が存在する場合の手法を提案する。
本稿では、ドメイン適応決定木(DADT)を導入して、ドメイン適応文学に貢献する。
他のより複雑なモデルと比較して、その解釈性とパフォーマンスのために人気が高まり、意思決定木にフォーカスしています。
DADTでは、ターゲットドメイン(またはテストデータ)とは異なるソースドメイン(またはトレーニングデータ)でトレーニングされたモデルの精度を改善することを目的としています。
対象人口の分布に対応する外部情報を用いて情報ゲイン分割基準を調整する処理ステップを提案する。
実データ上でDADTを実証し、シフトしたターゲット集団でテストする場合、標準決定木よりも精度が向上することを示す。
また,人口格差と平等な機会の下での公平性の変化についても検討した。
その結果,DADTにより公正性が向上した。
関連論文リスト
- Mitigating the Bias in the Model for Continual Test-Time Adaptation [32.33057968481597]
連続的テスト時間適応(Continuous Test-Time Adaptation, CTA)は、ソース事前学習モデルを目標ドメインの継続的な変更に適応させることを目的とした、困難なタスクである。
対象データの連鎖分布に常に適応するため、モデルは非常に偏りのある予測を示す。
本稿では,CTAシナリオの性能向上のために,この問題を緩和する。
論文 参考訳(メタデータ) (2024-03-02T23:37:16Z) - GAN-based Domain Inference Attack [3.731168012111833]
本稿では,GAN(Generative Adversarial Network)に基づく,対象モデルの潜在的ないし類似した領域を探索する手法を提案する。
ドメインがターゲットドメインとより類似している場合、ターゲットモデルがトレーニング手順の邪魔をしなくなる可能性がある。
実験の結果,MDIトップランクドメインからの補助データセットは,モデル反転攻撃の結果を効果的に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-12-22T15:40:53Z) - Source-Free Domain Adaptation via Distribution Estimation [106.48277721860036]
ドメイン適応は、ラベル付きソースドメインから学んだ知識を、データ分散が異なるラベル付きターゲットドメインに転送することを目的としています。
近年,ソースフリードメイン適応 (Source-Free Domain Adaptation, SFDA) が注目されている。
本研究では,SFDA-DEと呼ばれる新しいフレームワークを提案し,ソース分布推定によるSFDAタスクに対処する。
論文 参考訳(メタデータ) (2022-04-24T12:22:19Z) - How to Learn when Data Gradually Reacts to Your Model [10.074466859579571]
我々は,これらの効果が存在する場合でも,性能損失を最小限に抑えるための新しいアルゴリズム Stateful Performative Gradient Descent (Stateful PerfGD) を提案する。
実験の結果, Stateful PerfGD は従来の最先端手法よりもかなり優れていたことが確認された。
論文 参考訳(メタデータ) (2021-12-13T22:05:26Z) - On-target Adaptation [82.77980951331854]
ドメイン適応は、Emphtargetドメインでのトレーニングとテストの間のシフトを軽減することを目指している。
ほとんどの適応法は、ソースデータとターゲットデータに対する共同最適化によるソースデータに依存している。
対象データから純粋に表現を学習するオン・ターゲット適応による大幅な改善を示す。
論文 参考訳(メタデータ) (2021-09-02T17:04:18Z) - Model Transferability With Responsive Decision Subjects [11.07759054787023]
我々は、利用可能なソース分布でトレーニングされたモデルの性能が、その誘導されたドメインのパフォーマンスにどのように変換されるかを研究することによって、モデルの転送可能性に関する議論を形式化する。
我々は、誘導されたドメインシフトによるパフォーマンスギャップの上限と、分類器がソーストレーニング分布または誘導されたターゲット分布に悩まさなければならないトレードオフの上限の両方を提供する。
論文 参考訳(メタデータ) (2021-07-13T08:21:37Z) - Distill and Fine-tune: Effective Adaptation from a Black-box Source
Model [138.12678159620248]
Unsupervised Domain Adapt (UDA) は、既存のラベル付きデータセット (source) の知識を新しいラベル付きデータセット (target) に転送することを目的としています。
Distill and Fine-tune (Dis-tune) という新しい二段階適応フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-04T05:29:05Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Selecting Treatment Effects Models for Domain Adaptation Using Causal
Knowledge [82.5462771088607]
監視されていないドメイン適応設定下でITE法用に特別に設計された新しいモデル選択メトリックを提案する。
特に,介入効果の予測が対象領域の既知の因果構造を満たすモデルを選択することを提案する。
論文 参考訳(メタデータ) (2021-02-11T21:03:14Z) - Estimating Generalization under Distribution Shifts via Domain-Invariant
Representations [75.74928159249225]
未知の真のターゲットラベルのプロキシとして、ドメイン不変の予測器のセットを使用します。
結果として生じるリスク見積の誤差は、プロキシモデルのターゲットリスクに依存する。
論文 参考訳(メタデータ) (2020-07-06T17:21:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。