論文の概要: SOMtime the World Ain$'$t Fair: Violating Fairness Using Self-Organizing Maps
- arxiv url: http://arxiv.org/abs/2602.18201v1
- Date: Fri, 20 Feb 2026 13:25:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.336773
- Title: SOMtime the World Ain$'$t Fair: Violating Fairness Using Self-Organizing Maps
- Title(参考訳): SOMtime the World Ain$'$t Fair: 自己組織化マップによるフェアネスの違反
- Authors: Joseph Bingham, Netanel Arussy, Dvir Aran,
- Abstract要約: 教師なし表現は、これらの属性がトレーニングから守られていないとき、センシティブな属性に対して中立であると仮定される。
そこで本研究では, 年齢や所得などのセンシティブな属性が, 純粋に教師なし埋め込みにおいて支配的な潜伏軸として現れることを示した。
- 参考スコア(独自算出の注目度): 1.1470070927586018
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised representations are widely assumed to be neutral with respect to sensitive attributes when those attributes are withheld from training. We show that this assumption is false. Using SOMtime, a topology-preserving representation method based on high-capacity Self-Organizing Maps, we demonstrate that sensitive attributes such as age and income emerge as dominant latent axes in purely unsupervised embeddings, even when explicitly excluded from the input. On two large-scale real-world datasets (the World Values Survey across five countries and the Census-Income dataset), SOMtime recovers monotonic orderings aligned with withheld sensitive attributes, achieving Spearman correlations of up to 0.85, whereas PCA and UMAP typically remain below 0.23 (with a single exception reaching 0.31), and against t-SNE and autoencoders which achieve at most 0.34. Furthermore, unsupervised segmentation of SOMtime embeddings produces demographically skewed clusters, demonstrating downstream fairness risks without any supervised task. These findings establish that \textit{fairness through unawareness} fails at the representation level for ordinal sensitive attributes and that fairness auditing must extend to unsupervised components of machine learning pipelines. We have made the code available at~ https://github.com/JosephBingham/SOMtime
- Abstract(参考訳): 教師なし表現は、これらの属性がトレーニングから守られていないとき、センシティブな属性に対して中立であると広く考えられている。
この仮定は誤りであることを示す。
高容量自己組織化マップに基づくトポロジ保存表現法SOMtimeを用いて,入力から明示的に除外された場合でも,年齢や所得などのセンシティブな属性が純粋に教師なし埋め込みにおいて支配的な潜伏軸として現れることを示した。
大規模な実世界の2つのデータセット(5か国にわたる世界価値調査(World Values Survey)と国勢調査-所得データセット(Census-Income dataset))では、SOMtimeは、保持されていない機密属性と整合したモノトニック順序を回復し、最大0.85のスピアマン相関を達成し、PCAとUMAPは0.23未満(例外は0.31)、t-SNEとオートエンコーダは0.34以上である。
さらに、SOMtime 埋め込みの教師なしセグメンテーションは、階層的に歪んだクラスタを生成し、教師なしタスクなしで下流の公平性リスクを示す。
これらの結果から,'textit{fairness through unawareness} は順序に敏感な属性の表現レベルでは失敗し,公平性監査は機械学習パイプラインの教師なしコンポーネントにまで拡張されなければならないことが判明した。
私たちは https://github.com/JosephBingham/SOMtime でコードを公開しました。
関連論文リスト
- Enhancing Fairness in Unsupervised Graph Anomaly Detection through Disentanglement [33.565252991113766]
グラフ異常検出(GAD)は、金融詐欺検出から偽ニュース検出まで、さまざまなアプリケーションにおいてますます重要になっている。
現在のGAD法は主に公平性の問題を見落としており、特定の人口集団に対して差別的な決定が下される可能性がある。
DeFENDという属性グラフ上に,DisEntangle-based FairnEss-aware aNomaly Detectionフレームワークを考案した。
実世界のデータセットに対する実証的な評価から、DEFENDはGADにおいて効果的に機能し、最先端のベースラインと比較して公正性を著しく向上することが明らかとなった。
論文 参考訳(メタデータ) (2024-06-03T04:48:45Z) - CurvFed: Curvature-Aligned Federated Learning for Fairness without Demographics [2.7310171802144136]
本稿では,CurvFed: Curvature Aligned Federated Learning for Fairness without Demographicsを紹介する。
CurvFedは、統計情報やセンシティブな属性情報を必要とせずにFLの公平性を促進する。
これは、未知または複数のバイアス要素を持つ単一または複数ユーザーエッジデバイスを含む実世界のFLシナリオに特に適している。
論文 参考訳(メタデータ) (2024-04-30T17:19:52Z) - Practical Bias Mitigation through Proxy Sensitive Attribute Label
Generation [0.0]
本稿では,非教師なし埋め込み生成の2段階的アプローチとクラスタリングによるプロキシ・センシティブなラベルの取得を提案する。
我々の研究の有効性は、バイアスが感度属性と相関する非感度属性を通して伝播するという仮定に依存している。
実験結果から、Fair MixupやAdversarial Debiasingといった既存のアルゴリズムによるバイアス緩和は、導出されたプロキシラベルに匹敵する結果をもたらすことが示された。
論文 参考訳(メタデータ) (2023-12-26T10:54:15Z) - RoPAWS: Robust Semi-supervised Representation Learning from Uncurated
Data [37.93552560406823]
PAWSのような画像分類のための最先端の半教師付き手法は、キュレートされたデータで学習された自己教師付き表現に依存している。
我々は、現実世界のラベルなしデータを扱うことができるPAWSの堅牢な拡張であるRoPAWSを提案する。
我々は、RoPAWSが未処理のSemi-iNatのPAWSを+5.3%改善し、ImageNetを+0.4%改善したことを実証した。
論文 参考訳(メタデータ) (2023-02-28T10:54:36Z) - Confident Sinkhorn Allocation for Pseudo-Labeling [40.883130133661304]
半教師付き学習は、ラベル付きデータへの機械学習の依存を減らす重要なツールである。
本稿では,疑似ラベル作成における不確実性の役割を理論的に研究し,CSA(Confident Sinkhorn Allocation)を提案する。
CSAは、信頼度の高いサンプルのみへの最適な輸送を通して、最高の擬似ラベル割り当てを特定する。
論文 参考訳(メタデータ) (2022-06-13T02:16:26Z) - Semi-FairVAE: Semi-supervised Fair Representation Learning with
Adversarial Variational Autoencoder [92.67156911466397]
逆変分オートエンコーダに基づく半教師付き公正表現学習手法を提案する。
我々は、バイアス認識モデルを用いて、機密属性の固有バイアス情報をキャプチャする。
また、偏見のないモデルを用いて、対立学習を用いて偏見情報を取り除き、偏見のない公正表現を学習する。
論文 参考訳(メタデータ) (2022-04-01T15:57:47Z) - Unsupervised Learning of Debiased Representations with Pseudo-Attributes [85.5691102676175]
教師なし方式で,単純かつ効果的な脱バイアス手法を提案する。
特徴埋め込み空間上でクラスタリングを行い、クラスタリング結果を利用して疑似属性を識別する。
次に,非偏り表現を学習するために,クラスタベースの新しい重み付け手法を用いる。
論文 参考訳(メタデータ) (2021-08-06T05:20:46Z) - Fairness via Representation Neutralization [60.90373932844308]
フェアネスのための表現中立化(Representation Neutralization for Fairness, RNF)という新たな緩和手法を提案する。
RNFは、DNNモデルのタスク固有の分類ヘッダのみをデバイアスすることで、その公平性を達成する。
複数のベンチマークデータセットに対する実験結果は、DNNモデルの識別を効果的に削減するRNFフレームワークを実証している。
論文 参考訳(メタデータ) (2021-06-23T22:26:29Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。