論文の概要: Statistical Learning under Heterogenous Distribution Shift
- arxiv url: http://arxiv.org/abs/2302.13934v2
- Date: Sun, 8 Oct 2023 17:20:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 14:26:24.884703
- Title: Statistical Learning under Heterogenous Distribution Shift
- Title(参考訳): 異種分布シフトによる統計的学習
- Authors: Max Simchowitz, Anurag Ajay, Pulkit Agrawal, Akshay Krishnamurthy
- Abstract要約: ground-truth predictor is additive $mathbbE[mathbfz mid mathbfx,mathbfy] = f_star(mathbfx) +g_star(mathbfy)$.
クラス $F$ が$G$ よりも "simpler" であるとき、予測子は $textbfheterogenous shifts$ よりレジリエントであることを示します。
- 参考スコア(独自算出の注目度): 71.8393170225794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the prediction of a target $\mathbf{z}$ from a pair of
random variables $(\mathbf{x},\mathbf{y})$, where the ground-truth predictor is
additive $\mathbb{E}[\mathbf{z} \mid \mathbf{x},\mathbf{y}] =
f_\star(\mathbf{x}) +g_{\star}(\mathbf{y})$. We study the performance of
empirical risk minimization (ERM) over functions $f+g$, $f \in F$ and $g \in
G$, fit on a given training distribution, but evaluated on a test distribution
which exhibits covariate shift. We show that, when the class $F$ is "simpler"
than $G$ (measured, e.g., in terms of its metric entropy), our predictor is
more resilient to $\textbf{heterogenous covariate shifts}$ in which the shift
in $\mathbf{x}$ is much greater than that in $\mathbf{y}$. Our analysis
proceeds by demonstrating that ERM behaves $\textbf{qualitatively similarly to
orthogonal machine learning}$: the rate at which ERM recovers the $f$-component
of the predictor has only a lower-order dependence on the complexity of the
class $G$, adjusted for partial non-indentifiability introduced by the additive
structure. These results rely on a novel H\"older style inequality for the
Dudley integral which may be of independent interest. Moreover, we corroborate
our theoretical findings with experiments demonstrating improved resilience to
shifts in "simpler" features across numerous domains.
- Abstract(参考訳): 本論では、一対の確率変数 $(\mathbf{x},\mathbf{y})$ からターゲット $\mathbf{z}$ の予測について検討する。そこで、基底トラス予測子は加法的 $\mathbb{E}[\mathbf{z} \mid \mathbf{x},\mathbf{y}] = f_\star(\mathbf{x}) +g_{\star}(\mathbf{y})$ である。
実験的リスク最小化(ERM)を,与えられたトレーニング分布に適合する関数$f+g$,$f \in F$,$g \in G$に対して検討するが,共変量シフトを示すテスト分布で評価する。
F$ が $G$ よりも "単純" であるとき(例えば、計量エントロピーの観点から測れば)、我々の予測子は $\textbf{heterogenous covariate shifts}$ より弾力性があり、$\mathbf{x}$ のシフトは $\mathbf{y}$ のそれよりもはるかに大きい。
我々の分析は、ERMが直交機械学習と同じような振る舞いをすることを示す。$: ERMが予測子の$f$成分を回復する速度は、加法構造によって導入された部分的不確定性のために調整されたクラス$G$の複雑さにしか依存しない。
