論文の概要: Omnipredicting Single-Index Models with Multi-Index Models
- Date: Wed, 20 Nov 2024 07:20:49 GMT
- Title: Omnipredicting Single-Index Models with Multi-Index Models
- Title(参考訳): 複数インデックスモデルによる単一インデックスモデルの予測
- Authors: Lunjia Hu, Kevin Tian, Chutong Yang,
- Abstract要約: 単調なリプシッツリンク関数によって引き起こされる任意の損失に対して、$varepsilon$-competitive であるオムニプレクタを出力する学習者を与える。
我々のアルゴリズムでは,$approx varepsilon-4$サンプルをほぼ線形時間で実行し,リンク関数がbi-Lipschitzであれば$approx varepsilon-2$に改善する。
- Abstract: Recent work on supervised learning [GKR+22] defined the notion of omnipredictors, i.e., predictor functions $p$ over features that are simultaneously competitive for minimizing a family of loss functions $\mathcal{L}$ against a comparator class $\mathcal{C}$. Omniprediction requires approximating the Bayes-optimal predictor beyond the loss minimization paradigm, and has generated significant interest in the learning theory community. However, even for basic settings such as agnostically learning single-index models (SIMs), existing omnipredictor constructions require impractically-large sample complexities and runtimes, and output complex, highly-improper hypotheses. Our main contribution is a new, simple construction of omnipredictors for SIMs. We give a learner outputting an omnipredictor that is $\varepsilon$-competitive on any matching loss induced by a monotone, Lipschitz link function, when the comparator class is bounded linear predictors. Our algorithm requires $\approx \varepsilon^{-4}$ samples and runs in nearly-linear time, and its sample complexity improves to $\approx \varepsilon^{-2}$ if link functions are bi-Lipschitz. This significantly improves upon the only prior known construction, due to [HJKRR18, GHK+23], which used $\gtrsim \varepsilon^{-10}$ samples. We achieve our construction via a new, sharp analysis of the classical Isotron algorithm [KS09, KKKS11] in the challenging agnostic learning setting, of potential independent interest. Previously, Isotron was known to properly learn SIMs in the realizable setting, as well as constant-factor competitive hypotheses under the squared loss [ZWDD24]. As they are based on Isotron, our omnipredictors are multi-index models with $\approx \varepsilon^{-2}$ prediction heads, bringing us closer to the tantalizing goal of proper omniprediction for general loss families and comparators.
- Abstract(参考訳): 教師付き学習 [GKR+22] に関する最近の研究は、オムニプレクタの概念、すなわち、損失関数の族である$\mathcal{L}$を、コンパレータクラス$\mathcal{C}$に対して最小化するために同時に競合する機能に対して$p$という予測関数を定義している。
Omniprediction は損失最小化パラダイムを超えてベイズ最適予測器を近似する必要がある。
我々のアルゴリズムは、$\approx \varepsilon^{-4}$サンプルをほぼ直線的に実行し、リンク関数がbi-Lipschitzであれば、そのサンプルの複雑さは$\approx \varepsilon^{-2}$に改善される。
これは、$\gtrsim \varepsilon^{-10}$サンプルを使用した[HJKRR18, GHK+23]のため、既知の唯一の構造よりも大幅に改善されている。
我々は,従来のアイソトロンアルゴリズム[KS09, KKKS11]を,潜在的な独立性のある学習環境において,新しい鋭い解析によって構築する。
それらはアイソトロンをベースとしており、我々のOmnipredictorは$\approx \varepsilon^{-2}$予測ヘッドを持つマルチインデックスモデルであり、一般の損失族やコンパレータに対する適切なOmnipredictionという具体的な目標に近づいている。
