論文の概要: Attribute-Efficient PAC Learning of Low-Degree Polynomial Threshold
Functions with Nasty Noise
- arxiv url: http://arxiv.org/abs/2306.00673v1
- Date: Thu, 1 Jun 2023 13:49:22 GMT
- Title: Attribute-Efficient PAC Learning of Low-Degree Polynomial Threshold
Functions with Nasty Noise
- Title(参考訳): 雑音を考慮した低次多項式閾値関数の属性効率PAC学習
- Authors: Shiwei Zeng and Jie Shen
- Abstract要約: 我々は、$mathbbRn$で$K$sparse degree-$d$ PTFsのPAC学習を研究する。
PACは$eta leq O(epsilond)であっても$O(fracK4depsilon2d cdot log5d n)$でエラー率$epsilon$までクラスを学習する
- 参考スコア(独自算出の注目度): 7.594050968868919
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The concept class of low-degree polynomial threshold functions (PTFs) plays a
fundamental role in machine learning. In this paper, we study PAC learning of
$K$-sparse degree-$d$ PTFs on $\mathbb{R}^n$, where any such concept depends
only on $K$ out of $n$ attributes of the input. Our main contribution is a new
algorithm that runs in time $({nd}/{\epsilon})^{O(d)}$ and under the Gaussian
marginal distribution, PAC learns the class up to error rate $\epsilon$ with
$O(\frac{K^{4d}}{\epsilon^{2d}} \cdot \log^{5d} n)$ samples even when an $\eta
\leq O(\epsilon^d)$ fraction of them are corrupted by the nasty noise of
Bshouty et al. (2002), possibly the strongest corruption model. Prior to this
work, attribute-efficient robust algorithms are established only for the
special case of sparse homogeneous halfspaces. Our key ingredients are: 1) a
structural result that translates the attribute sparsity to a sparsity pattern
of the Chow vector under the basis of Hermite polynomials, and 2) a novel
attribute-efficient robust Chow vector estimation algorithm which uses
exclusively a restricted Frobenius norm to either certify a good approximation
or to validate a sparsity-induced degree-$2d$ polynomial as a filter to detect
corrupted samples.
- Abstract(参考訳): 低次多項式しきい値関数(PTF)の概念クラスは、機械学習において基本的な役割を果たす。
本稿では,$K$-sparse degree-$d$ PTFs on $\mathbb{R}^n$のPAC学習について検討する。
私たちの主な貢献は、時間$({nd}/{\epsilon})^{o(d)}$で実行され、ガウス境界分布の下で、pacはエラーレート$\epsilon$のクラスを学習し、$o(\frac{k^{4d}}{\epsilon^{2d}} \cdot \log^{5d} n)$サンプルは$\eta \leq o(\epsilon^d)$がbshouty et al. (2002)の厄介なノイズによって損なわれる場合であっても、おそらく最も強力な腐敗モデルである。
1) ハーマイト多項式に基づくChowベクトルのスパーシティパターンに属性のスパーシティを変換する構造的結果、及び
2) 制限されたフロベニウスノルムのみを用いて,良好な近似を証明したり, 破損したサンプルを検出するフィルタとして, 疎度誘起次数-$2d$多項式の検証を行う新しい属性効率の強いChowベクトル推定アルゴリズム。
