論文の概要: Fairness-aware Multi-view Clustering
- arxiv url: http://arxiv.org/abs/2302.05788v1
- Date: Sat, 11 Feb 2023 21:36:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 18:33:52.099350
- Title: Fairness-aware Multi-view Clustering
- Title(参考訳): フェアネスを考慮したマルチビュークラスタリング
- Authors: Lecheng Zheng, Yada Zhu, Jingrui He
- Abstract要約: フェアネスを考慮したマルチビュークラスタリング手法FairMVCを提案する。
グループフェアネス制約を各クラスタのソフトメンバシップ割り当てに組み込んで、各クラスタ内の異なるグループの分断がデータセット全体とほぼ同じであることを保証します。
また,不均一なデータを扱う新たな正規化器を提案する。
- 参考スコア(独自算出の注目度): 41.479310583848246
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the era of big data, we are often facing the challenge of data
heterogeneity and the lack of label information simultaneously. In the
financial domain (e.g., fraud detection), the heterogeneous data may include
not only numerical data (e.g., total debt and yearly income), but also text and
images (e.g., financial statement and invoice images). At the same time, the
label information (e.g., fraud transactions) may be missing for building
predictive models. To address these challenges, many state-of-the-art
multi-view clustering methods have been proposed and achieved outstanding
performance. However, these methods typically do not take into consideration
the fairness aspect and are likely to generate biased results using sensitive
information such as race and gender. Therefore, in this paper, we propose a
fairness-aware multi-view clustering method named FairMVC. It incorporates the
group fairness constraint into the soft membership assignment for each cluster
to ensure that the fraction of different groups in each cluster is
approximately identical to the entire data set. Meanwhile, we adopt the idea of
both contrastive learning and non-contrastive learning and propose novel
regularizers to handle heterogeneous data in complex scenarios with missing
data or noisy features. Experimental results on real-world data sets
demonstrate the effectiveness and efficiency of the proposed framework. We also
derive insights regarding the relative performance of the proposed regularizers
in various scenarios.
- Abstract(参考訳): ビッグデータの時代、私たちはしばしば、データの均一性とラベル情報の欠如という課題に直面しています。
金融分野(例えば不正検出)では、不均質なデータは、数値データ(例えば、合計負債や年収)だけでなく、テキストや画像(例えば、財務諸表や請求書画像)を含むことができる。
同時に、予測モデルを構築するためにラベル情報(例えば不正取引)が欠落している可能性がある。
これらの課題に対処するため、最先端のマルチビュークラスタリング手法が数多く提案され、優れた性能を達成している。
しかし、これらの手法は概して公平性を考慮せず、人種や性別などのセンシティブな情報を用いて偏見のある結果を生成する傾向にある。
そこで本稿では,fairmvcと呼ばれるフェアネス対応マルチビュークラスタリング手法を提案する。
グループフェアネス制約を各クラスタのソフトメンバーシップ割り当てに組み込んで、各クラスタ内の異なるグループの割合がデータセット全体とほぼ同一であることを保証する。
一方,コントラスト学習と非コントラスト学習という概念を採用し,データ不足やノイズのある複雑なシナリオにおいて異種データを扱うための新しい正規化器を提案する。
実世界のデータセットにおける実験結果は,提案フレームワークの有効性と効率を示す。
また,様々なシナリオにおいて提案した正則化器の相対性能について考察する。
関連論文リスト
- Evidential Deep Partial Multi-View Classification With Discount Fusion [24.139495744683128]
Evidential Deep partial Multi-View Classification (EDP-MVC) と呼ばれる新しいフレームワークを提案する。
欠落したビューに対処するためにK-means命令を使用し、マルチビューデータの完全なセットを作成します。
この暗示されたデータ内の潜在的な衝突や不確実性は、下流の推論の信頼性に影響を与える可能性がある。
論文 参考訳(メタデータ) (2024-08-23T14:50:49Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - Fair Federated Learning for Heterogeneous Face Data [10.707311210901548]
フェデレートラーニング(FL)において、データの不均一性の下で公平に分類することの問題点を考察する。
公平な分類のために提案されたアプローチのほとんどは、関係する異なる人口集団を表す多様なデータを必要とする。
対照的に、各クライアントは単一の人口グループのみを表すデータを所有することが一般的である。
論文 参考訳(メタデータ) (2021-09-06T10:44:16Z) - MultiFair: Multi-Group Fairness in Machine Learning [52.24956510371455]
機械学習におけるマルチグループフェアネスの研究(MultiFair)
この問題を解決するために,汎用的なエンドツーエンドのアルゴリズムフレームワークを提案する。
提案するフレームワークは多くの異なる設定に一般化可能である。
論文 参考訳(メタデータ) (2021-05-24T02:30:22Z) - Error-Robust Multi-View Clustering: Progress, Challenges and
Opportunities [67.54503077766171]
ラベル情報は取得に費用がかかることが多いため、マルチビュークラスタリングが注目されている。
明示的なエラー除去定式化によるエラーロバストマルチビュークラスタリングアプローチは、5つの広範な研究カテゴリに構成できる。
この調査は、マルチビューデータに対するエラーロストクラスタリングの最近の進歩を要約し、レビューする。
論文 参考訳(メタデータ) (2021-05-07T04:03:02Z) - Joint Representation Learning and Novel Category Discovery on Single-
and Multi-modal Data [16.138075558585516]
信頼性の高い表現を共同学習し、ラベルなしのデータにクラスタを割り当てる汎用的なエンドツーエンドフレームワークを提案する。
我々は共有表現空間にウィナーテイクオール(wta)ハッシュアルゴリズムを採用し,ラベルなしデータに対してペアワイズ擬似ラベルを生成する。
大規模マルチモーダルビデオベンチマークKinetics-400およびVGG-Sound、および画像ベンチマークCIFAR10、CIFAR100およびImageNetに関するフレームワークを徹底的に評価します。
論文 参考訳(メタデータ) (2021-04-26T15:56:16Z) - Learning to Generate Fair Clusters from Demonstrations [27.423983748614198]
本稿では,専門家による限定的な実証に基づいて,問題に対する意図された公平性制約を特定する方法について述べる。
本稿では、実演からフェアネスメトリックを識別し、既存のオフザシェルフクラスタリング技術を用いてクラスタを生成するアルゴリズムを提案する。
本稿では,本手法を用いて解釈可能な解を生成する方法について検討する。
論文 参考訳(メタデータ) (2021-02-08T03:09:33Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。