論文の概要: Monge, Bregman and Occam: Interpretable Optimal Transport in
High-Dimensions with Feature-Sparse Maps
- arxiv url: http://arxiv.org/abs/2302.04065v1
- Date: Wed, 8 Feb 2023 14:02:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 16:22:30.254611
- Title: Monge, Bregman and Occam: Interpretable Optimal Transport in
High-Dimensions with Feature-Sparse Maps
- Title(参考訳): Monge, Bregman, Occam:特徴空間マップを用いた高次元の最適輸送の解釈
- Authors: Marco Cuturi, Michal Klein, Pierre Ablin
- Abstract要約: 我々は、$tau$ のスパース性誘導ノルムを選択すると、Occam のカミソリを輸送に応用する写像が得られることを示した。
- 参考スコア(独自算出の注目度): 37.45959537338404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimal transport (OT) theory focuses, among all maps
$T:\mathbb{R}^d\rightarrow \mathbb{R}^d$ that can morph a probability measure
onto another, on those that are the ``thriftiest'', i.e. such that the averaged
cost $c(x, T(x))$ between $x$ and its image $T(x)$ be as small as possible.
Many computational approaches have been proposed to estimate such Monge maps
when $c$ is the $\ell_2^2$ distance, e.g., using entropic maps [Pooladian'22],
or neural networks [Makkuva'20, Korotin'20]. We propose a new model for
transport maps, built on a family of translation invariant costs $c(x,
y):=h(x-y)$, where $h:=\tfrac{1}{2}\|\cdot\|_2^2+\tau$ and $\tau$ is a
regularizer. We propose a generalization of the entropic map suitable for $h$,
and highlight a surprising link tying it with the Bregman centroids of the
divergence $D_h$ generated by $h$, and the proximal operator of $\tau$. We show
that choosing a sparsity-inducing norm for $\tau$ results in maps that apply
Occam's razor to transport, in the sense that the displacement vectors
$\Delta(x):= T(x)-x$ they induce are sparse, with a sparsity pattern that
varies depending on $x$. We showcase the ability of our method to estimate
meaningful OT maps for high-dimensional single-cell transcription data, in the
$34000$-$d$ space of gene counts for cells, without using dimensionality
reduction, thus retaining the ability to interpret all displacements at the
gene level.
- Abstract(参考訳): 最適輸送 (OT) 理論は、すべての写像 $T:\mathbb{R}^d\rightarrow \mathbb{R}^d$ において、確率測度を ``thriftiest'' であるもの、すなわち平均的なコスト $c(x, T) に変形させることができることに焦点をあてる。
(x)$ をできるだけ小さくする。
例えば、エントロピー写像 [Pooladian'22] やニューラルネットワーク [Makkuva'20, Korotin'20] を用いて、$c$が$\ell_2^2$ 距離であるときに、そのようなモンジュ写像を推定する多くの計算手法が提案されている。
本研究では, 変換不変コスト$c(x, ) の族を基礎とした輸送写像の新しいモデルを提案する。
h:=\tfrac{1}{2}\|\cdot\|_2^2+\tau$ であり、$\tau$ は正規化である。
我々は、h$ に適したエントロピー写像の一般化を提案し、h$ によって生成される発散値 $d_h$ のbregman centroid と、$\tau$ の近位作用素との驚くべきリンクを強調する。
我々は、変位ベクトルが$\Delta であるという意味で、Occam's razor を輸送に適用する写像において、$\tau$ に対してスパース性誘導ノルムを選択することを示す。
(x)-x$ は sparse であり、$x$ に依存するスパーシティパターンがある。
