論文の概要: Fair Representation Clustering with Several Protected Classes
- arxiv url: http://arxiv.org/abs/2202.01391v1
- Date: Thu, 3 Feb 2022 03:45:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-04 14:45:09.782848
- Title: Fair Representation Clustering with Several Protected Classes
- Title(参考訳): いくつかの保護クラスによる公正表現クラスタリング
- Authors: Zhen Dai, Yury Makarychev, Ali Vakilian
- Abstract要約: 我々は、各クラスタが異なるグループから個人を公平に表現する必要があるフェア$k$-medianの問題を研究する。
我々は、$O(log k)$-approximationアルゴリズムを示し、$nO(ell)$で実行します。
- 参考スコア(独自算出の注目度): 13.53362222844008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of fair $k$-median where each cluster is required to
have a fair representation of individuals from different groups. In the fair
representation $k$-median problem, we are given a set of points $X$ in a metric
space. Each point $x\in X$ belongs to one of $\ell$ groups. Further, we are
given fair representation parameters $\alpha_j$ and $\beta_j$ for each group
$j\in [\ell]$. We say that a $k$-clustering $C_1, \cdots, C_k$ fairly
represents all groups if the number of points from group $j$ in cluster $C_i$
is between $\alpha_j |C_i|$ and $\beta_j |C_i|$ for every $j\in[\ell]$ and
$i\in [k]$. The goal is to find a set $\mathcal{C}$ of $k$ centers and an
assignment $\phi: X\rightarrow \mathcal{C}$ such that the clustering defined by
$(\mathcal{C}, \phi)$ fairly represents all groups and minimizes the
$\ell_1$-objective $\sum_{x\in X} d(x, \phi(x))$.
We present an $O(\log k)$-approximation algorithm that runs in time
$n^{O(\ell)}$. Note that the known algorithms for the problem either (i)
violate the fairness constraints by an additive term or (ii) run in time that
is exponential in both $k$ and $\ell$. We also consider an important special
case of the problem where $\alpha_j = \beta_j = \frac{f_j}{f}$ and $f_j, f \in
\mathbb{N}$ for all $j\in [\ell]$. For this special case, we present an $O(\log
k)$-approximation algorithm that runs in $(kf)^{O(\ell)}\log n + poly(n)$ time.
- Abstract(参考訳): 我々は、各クラスタが異なるグループの個人を公平に表現する必要があるフェア$k$-medianの問題を研究する。
公正表現 $k$-median 問題では、計量空間において点のセット $x$ が与えられる。
各点 $x\in x$ は $\ell$ グループに属する。
さらに、各群 $j\in [\ell]$ に対して、フェア表現パラメータ $\alpha_j$ と $\beta_j$ が与えられる。
a $k$-clustering $C_1, \cdots, C_k$ が全ての群を表すのは、群 $j$ in cluster $C_i$ が $\alpha_j |C_i|$ と $\beta_j |C_i|$ の間にあるときである。
その目的は、$(\mathcal{c}, \phi)$ で定義されるクラスタリングがすべての群を表し、$\ell_1$-objective $\sum_{x\in x} d(x, \phi(x))$ を最小化するような、$\phi: x\rightarrow \mathcal{c}$ と$\phi: x\rightarrow \mathcal{c}$ を見つけることである。
我々は、$n^{o(\ell)}$で実行される$o(\log k)$近似アルゴリズムを示す。
また、すべての$j\in [\ell]$に対して、$\alpha_j = \beta_j = \frac{f_j}{f}$ と $f_j, f \in \mathbb{N}$ が問題の重要な特別な場合を考える。
この特別な場合には、$(kf)^{o(\ell)}\log n + poly(n)$ timeで実行される$o(\log k)$近似アルゴリズムを示す。
