論文の概要: Parameterized Approximation for Robust Clustering in Discrete Geometric
- arxiv url: http://arxiv.org/abs/2305.07316v1
- Date: Fri, 12 May 2023 08:43:28 GMT
- Title: Parameterized Approximation for Robust Clustering in Discrete Geometric
- Title(参考訳): 離散幾何学空間におけるロバストクラスタリングのパラメータ近似
- Authors: Fateme Abbasi, Sandip Banerjee, Jaros{\l}aw Byrka, Parinya
Chalermsook, Ameet Gadekar, Kamyar Khodamoradi, D\'aniel Marx, Roohani
Sharma, and Joachim Spoerhase
- Abstract要約: 次元$Theta(log n)$ が $(sqrt3/2-o(1))$hard である場合でさえ、FPTアルゴリズムを近似する。
また、次元 $Theta(log n)$ が $(sqrt3/2-o(1))$hard であるような特別な場合でさえ、FPTアルゴリズムを近似することを示す。
- 参考スコア(独自算出の注目度): 0.6732660670243813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the well-studied Robust $(k, z)$-Clustering problem, which
generalizes the classic $k$-Median, $k$-Means, and $k$-Center problems. Given a
constant $z\ge 1$, the input to Robust $(k, z)$-Clustering is a set $P$ of $n$
weighted points in a metric space $(M,\delta)$ and a positive integer $k$.
Further, each point belongs to one (or more) of the $m$ many different groups
$S_1,S_2,\ldots,S_m$. Our goal is to find a set $X$ of $k$ centers such that
$\max_{i \in [m]} \sum_{p \in S_i} w(p) \delta(p,X)^z$ is minimized.
This problem arises in the domains of robust optimization [Anthony, Goyal,
Gupta, Nagarajan, Math. Oper. Res. 2010] and in algorithmic fairness. For
polynomial time computation, an approximation factor of $O(\log m/\log\log m)$
is known [Makarychev, Vakilian, COLT $2021$], which is tight under a plausible
complexity assumption even in the line metrics. For FPT time, there is a
$(3^z+\epsilon)$-approximation algorithm, which is tight under GAP-ETH [Goyal,
Jaiswal, Inf. Proc. Letters, 2023].
Motivated by the tight lower bounds for general discrete metrics, we focus on
\emph{geometric} spaces such as the (discrete) high-dimensional Euclidean
setting and metrics of low doubling dimension, which play an important role in
data analysis applications. First, for a universal constant $\eta_0 >0.0006$,
we devise a $3^z(1-\eta_{0})$-factor FPT approximation algorithm for discrete
high-dimensional Euclidean spaces thereby bypassing the lower bound for general
metrics. We complement this result by showing that even the special case of
$k$-Center in dimension $\Theta(\log n)$ is $(\sqrt{3/2}- o(1))$-hard to
approximate for FPT algorithms. Finally, we complete the FPT approximation
landscape by designing an FPT $(1+\epsilon)$-approximation scheme (EPAS) for
the metric of sub-logarithmic doubling dimension.
- Abstract(参考訳): 我々は、古典的な$k$-Median, $k$-Means, $k$-Center問題を一般化する、よく研究されたRobust $(k, z)$-Clustering問題を考える。
定数 $z\ge 1$ が与えられたとき、Robust $(k, z)$-Clustering への入力は、計量空間 $(M,\delta)$ における集合 $P$ of $n$ 重み付き点と正の整数 $k$ である。
我々の目標は、$\max_{i \in [m]} \sum_{p \in s_i} w(p) \delta(p,x)^z$ が最小となるような、$k$ 中心のセット x$ を見つけることである。
この問題はロバスト最適化の領域(Anthony, Goyal, Gupta, Nagarajan, Math. Oper. Res. 2010)とアルゴリズムフェアネスの領域で発生する。
多項式時間計算の場合、$O(\log m/\log\log)の近似係数
m)$は[Makarychev, Vakilian, COLT 2021$]として知られています。
FPT時間には$(3^z+\epsilon)$-approximationアルゴリズムがあり、GAP-ETH(Goyal, Jaiswal, Inf. Proc. Letters, 2023)の下で厳密である。
まず、普遍定数 $\eta_0 >0.0006$ に対して、離散高次元ユークリッド空間に対する3^z(1-\eta_{0})$-factor FPT近似アルゴリズムを考案し、一般計量に対する下界をバイパスする。
この結果を補うために、次元 $\theta(\log) における $k$-center の特別な場合でさえも
n)$ は fpt アルゴリズムに対して近似するために $(\sqrt{3/2}- o(1))$-hard である。
最後に, 部分対数二重化次元の計量に対する fpt $(1+\epsilon)$-approximation scheme (epas) を設計することにより, fpt近似のランドスケープを完成させる。
