論文の概要: Almost Tight Approximation Algorithms for Explainable Clustering
- arxiv url: http://arxiv.org/abs/2107.00774v1
- Date: Thu, 1 Jul 2021 23:49:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-05 12:43:51.678339
- Title: Almost Tight Approximation Algorithms for Explainable Clustering
- Title(参考訳): 説明可能なクラスタリングのための近似近似アルゴリズム
- Authors: Hossein Esfandiari, Vahab Mirrokni, Shyam Narayanan
- Abstract要約: 本稿では,Dasguptaらによって提案された最近の説明可能なクラスタリングの枠組みについて考察する。
- 参考スコア(独自算出の注目度): 16.22135057266913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, due to an increasing interest for transparency in artificial
intelligence, several methods of explainable machine learning have been
developed with the simultaneous goal of accuracy and interpretability by
humans. In this paper, we study a recent framework of explainable clustering
first suggested by Dasgupta et al.~\cite{dasgupta2020explainable}.
Specifically, we focus on the $k$-means and $k$-medians problems and provide
nearly tight upper and lower bounds.
First, we provide an $O(\log k \log \log k)$-approximation algorithm for
explainable $k$-medians, improving on the best known algorithm of
$O(k)$~\cite{dasgupta2020explainable} and nearly matching the known
$\Omega(\log k)$ lower bound~\cite{dasgupta2020explainable}. In addition, in
low-dimensional spaces $d \ll \log k$, we show that our algorithm also provides
an $O(d \log^2 d)$-approximate solution for explainable $k$-medians. This
improves over the best known bound of $O(d \log k)$ for low
dimensions~\cite{laber2021explainable}, and is a constant for constant
dimensional spaces. To complement this, we show a nearly matching $\Omega(d)$
lower bound. Next, we study the $k$-means problem in this context and provide
an $O(k \log k)$-approximation algorithm for explainable $k$-means, improving
over the $O(k^2)$ bound of Dasgupta et al. and the $O(d k \log k)$ bound of
\cite{laber2021explainable}. To complement this we provide an almost tight
$\Omega(k)$ lower bound, improving over the $\Omega(\log k)$ lower bound of
Dasgupta et al. All our algorithms run in near linear time in the number of
points and the dimension.
- Abstract(参考訳): 近年、人工知能の透明性への関心が高まっているため、人間の正確性と解釈可能性を同時に目標とした説明可能な機械学習手法がいくつか開発されている。
本稿では,Dasgupta et al.~\cite{dasgupta2020explainable} が提案した最近のクラスタリングの枠組みについて述べる。
まず、$O(\log k \log \log k)$-approximation algorithm for explainable $k$-medians, improve on the best known algorithm of $O(k)$~\cite{dasgupta2020explainable} and almost matching the known $Omega(\log k)$ lower bound~\cite{dasgupta2020explainable}。
さらに、低次元空間における $d \ll \log k$ において、このアルゴリズムは、説明可能な $k$-medians に対して $o(d \log^2 d)$-approximate solution を提供する。
これは、低次元~\cite{laber2021explainable} に対する$O(d \log k)$の最もよく知られた境界よりも改善され、定数次元空間に対する定数である。
次に、この文脈で$k$-means問題を研究し、説明可能な$k$-meansに対する$o(k \log k)$近似アルゴリズムを提供し、dasgupta と al の$o(k^2)$バウンドよりも改善する。
and the $o(d k \log k)$ bound of \cite{laber2021explainable}。
これを補うために、ほぼ厳密な$\Omega(k)$low boundを提供し、$\Omega(\log k)$ lower bound of Dasgupta et al よりも改善する。
