論文の概要: Learning a Lie Algebra from Unlabeled Data Pairs
- arxiv url: http://arxiv.org/abs/2009.09321v3
- Date: Thu, 12 Nov 2020 09:29:36 GMT
- Title: Learning a Lie Algebra from Unlabeled Data Pairs
- Title(参考訳): ラベルのないデータペアからLie Algebraを学ぶ
- Authors: Christopher Ick and Vincent Lostanlen
- Abstract要約: 深層畳み込みネットワーク (convnets) は、非絡み合った表現を学習する顕著な能力を示している。
鍵となる考え方は、すべてのターゲット $boldsymboly_i$ を $boldsymbolwidetildey_i = boldsymbolphi(t_i) boldsymbolx_i$ という形の行列ベクトル積で近似することである。
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep convolutional networks (convnets) show a remarkable ability to learn
disentangled representations. In recent years, the generalization of deep
learning to Lie groups beyond rigid motion in $\mathbb{R}^n$ has allowed to
build convnets over datasets with non-trivial symmetries, such as patterns over
the surface of a sphere. However, one limitation of this approach is the need
to explicitly define the Lie group underlying the desired invariance property
before training the convnet. Whereas rotations on the sphere have a well-known
symmetry group ($\mathrm{SO}(3)$), the same cannot be said of many real-world
factors of variability. For example, the disentanglement of pitch, intensity
dynamics, and playing technique remains a challenging task in music information
This article proposes a machine learning method to discover a nonlinear
transformation of the space $\mathbb{R}^n$ which maps a collection of
$n$-dimensional vectors $(\boldsymbol{x}_i)_i$ onto a collection of target
vectors $(\boldsymbol{y}_i)_i$. The key idea is to approximate every target
$\boldsymbol{y}_i$ by a matrix--vector product of the form
$\boldsymbol{\widetilde{y}}_i = \boldsymbol{\phi}(t_i) \boldsymbol{x}_i$, where
the matrix $\boldsymbol{\phi}(t_i)$ belongs to a one-parameter subgroup of
$\mathrm{GL}_n (\mathbb{R})$. Crucially, the value of the parameter $t_i \in
\mathbb{R}$ may change between data pairs $(\boldsymbol{x}_i,
\boldsymbol{y}_i)$ and does not need to be known in advance.
- Abstract(参考訳): 深層畳み込みネットワーク (convnets) は、非絡み合った表現を学習する顕著な能力を示している。
近年、$\mathbb{R}^n$ の剛運動を超えたリー群への深層学習の一般化により、球面上のパターンのような非自明な対称性を持つデータセット上の畳み込みが可能である。
球面上の回転はよく知られた対称性群 ("\mathrm{SO}(3)$") を持つが、多くの実世界の変数因子について同じことは言えない。
本稿では,n$次元ベクトルの集合 $(\boldsymbol{x}_i)_i$ を対象ベクトルの集合 $(\boldsymbol{y}_i)_i$ に写像する空間 $\mathbb{R}^n$ の非線形変換を発見する機械学習手法を提案する。
鍵となるアイデアは、すべてのターゲット $\boldsymbol{y}_i$ を $\boldsymbol{\widetilde{y}}_i = \boldsymbol{\phi}(t_i) \boldsymbol{x}_i$ という形の行列ベクトル積で近似することであり、ここで行列 $\boldsymbol{\phi}(t_i)$ は $\mathrm{GL}_n (\mathbb{R})$ の1パラメータ部分群に属する。
重要なことに、パラメータ $t_i \in \mathbb{R}$ の値は、データペア $(\boldsymbol{x}_i, \boldsymbol{y}_i)$ の間で変化し、事前に知る必要はない。
