論文の概要: Evaluated CMI Bounds for Meta Learning: Tightness and Expressiveness
- arxiv url: http://arxiv.org/abs/2210.06511v1
- Date: Wed, 12 Oct 2022 18:10:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 15:16:53.529137
- Title: Evaluated CMI Bounds for Meta Learning: Tightness and Expressiveness
- Title(参考訳): メタ学習におけるcmi境界の評価 : タイトネスと表現力
- Authors: Fredrik Hellstr\"om and Giuseppe Durisi
- Abstract要約: 評価CMI(e-CMI)を用いたメタ学習のための新しい一般化境界を提案する。
e-CMI フレームワークは、$sqrt の数学カル C(mathcal H)/(nhat n) + 数学カル C(mathcal F)/n $, ここで $mathcal C(cdot)$ は仮説クラスの複雑性測度を表す。
- 参考スコア(独自算出の注目度): 14.147617330278662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work has established that the conditional mutual information (CMI)
framework of Steinke and Zakynthinou (2020) is expressive enough to capture
generalization guarantees in terms of algorithmic stability, VC dimension, and
related complexity measures for conventional learning (Harutyunyan et al.,
2021, Haghifam et al., 2021). Hence, it provides a unified method for
establishing generalization bounds. In meta learning, there has so far been a
divide between information-theoretic results and results from classical
learning theory. In this work, we take a first step toward bridging this
divide. Specifically, we present novel generalization bounds for meta learning
in terms of the evaluated CMI (e-CMI). To demonstrate the expressiveness of the
e-CMI framework, we apply our bounds to a representation learning setting, with
$n$ samples from $\hat n$ tasks parameterized by functions of the form $f_i
\circ h$. Here, each $f_i \in \mathcal F$ is a task-specific function, and $h
\in \mathcal H$ is the shared representation. For this setup, we show that the
e-CMI framework yields a bound that scales as $\sqrt{ \mathcal C(\mathcal
H)/(n\hat n) + \mathcal C(\mathcal F)/n} $, where $\mathcal C(\cdot)$ denotes a
complexity measure of the hypothesis class. This scaling behavior coincides
with the one reported in Tripuraneni et al. (2020) using Gaussian complexity.
- Abstract(参考訳): 最近の研究では、steinke and zakynthinou (2020) の条件付き相互情報(cmi)フレームワークは、アルゴリズムの安定性、vc次元、および従来の学習のための関連する複雑性尺度の観点から、一般化の保証を捉えるのに十分な表現力を持っている(haltyunyan et al., 2021, haghifam et al., 2021)。
e-CMIフレームワークの表現性を示すために、f_i \circ h$という形式の関数によってパラメータ化された$\hat n$タスクの$n$サンプルを表現学習設定に適用する。
ここで、各$f_i \in \mathcal f$ はタスク固有関数であり、$h \in \mathcal h$ は共有表現である。
この設定のために、e-CMIフレームワークは、$\sqrt{ \mathcal C(\mathcal H)/(n\hat n) + \mathcal C(\mathcal F)/n} $ とスケールする有界性を持ち、$\mathcal C(\cdot)$ は仮説クラスの複雑性測度を表す。
このスケーリング挙動は、Gaussian complexityを用いてTripuraneni et al. (2020)で報告されたものと一致する。
