論文の概要: Learning over von Mises-Fisher Distributions via a Wasserstein-like Geometry
- arxiv url: http://arxiv.org/abs/2504.14164v1
- Date: Sat, 19 Apr 2025 03:38:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 04:34:17.958937
- Title: Learning over von Mises-Fisher Distributions via a Wasserstein-like Geometry
- Title(参考訳): Wasserstein-like Geometry による von Mises-Fisher 分布の学習
- Authors: Kisung You, Dennis Shung, Mauro Giuffrè,
- Abstract要約: 我々は、フォン・ミセス・フィッシャー(vMF)分布の族に対する幾何対応距離計量を導入する。
最適輸送の理論により、2つの vMF 分布間の相違を2つの解釈可能な成分に分解するワッサーシュタインのような距離を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a novel, geometry-aware distance metric for the family of von Mises-Fisher (vMF) distributions, which are fundamental models for directional data on the unit hypersphere. Although the vMF distribution is widely employed in a variety of probabilistic learning tasks involving spherical data, principled tools for comparing vMF distributions remain limited, primarily due to the intractability of normalization constants and the absence of suitable geometric metrics. Motivated by the theory of optimal transport, we propose a Wasserstein-like distance that decomposes the discrepancy between two vMF distributions into two interpretable components: a geodesic term capturing the angular separation between mean directions, and a variance-like term quantifying differences in concentration parameters. The derivation leverages a Gaussian approximation in the high-concentration regime to yield a tractable, closed-form expression that respects the intrinsic spherical geometry. We show that the proposed distance exhibits desirable theoretical properties and induces a latent geometric structure on the space of non-degenerate vMF distributions. As a primary application, we develop the efficient algorithms for vMF mixture reduction, enabling structure-preserving compression of mixture models in high-dimensional settings. Empirical results on synthetic datasets and real-world high-dimensional embeddings, including biomedical sentence representations and deep visual features, demonstrate the effectiveness of the proposed geometry in distinguishing distributions and supporting interpretable inference. This work expands the statistical toolbox for directional data analysis by introducing a tractable, transport-inspired distance tailored to the geometry of the hypersphere.
- Abstract(参考訳): 単位超球面上の方向データの基本モデルであるvon Mises-Fisher (vMF) 分布の族に対する新しい幾何学的距離計量を導入する。
vMF分布は、球面データを含む様々な確率論的学習タスクに広く採用されているが、vMF分布を比較するための原則的ツールは、主に正規化定数の抽出可能性と適切な幾何学的指標の欠如のために制限されている。
最適輸送理論により、2つの vMF 分布間の相違を2つの解釈可能な成分に分解するワッサーシュタイン様距離を提案し、平均方向の角分離を捉える測地項と、濃度パラメータの差を定量化する分散的項を提案する。
この導出は、高濃度状態におけるガウス近似を利用して、本質的な球面幾何学を尊重する、引き込み可能な閉形式表現を生成する。
提案した距離は望ましい理論的性質を示し、非退化 vMF 分布の空間上の潜在幾何学的構造を誘導することを示す。
第一の応用として, 高次元環境下での混合モデルの構造保存圧縮が可能な, vMF混合還元のための効率的なアルゴリズムを開発した。
バイオメディカルな文表現や深い視覚特徴を含む合成データセットと実世界の高次元埋め込みに関する実証的な結果から,分布の識別や解釈可能な推論支援において,提案手法の有効性が示された。
この研究は、超球面の幾何学に合わせたトラクタブルで輸送にインスパイアされた距離を導入することで、方向データ解析のための統計ツールボックスを拡張する。
関連論文リスト
- Metric Flow Matching for Smooth Interpolations on the Data Manifold [40.24392451848883]
Metric Flow Matching (MFM) は条件付きフローマッチングのための新しいシミュレーションフリーフレームワークである。
我々は,MFMを条件付き経路のフレームワークとして提案し,ソース分布をターゲット分布に変換する。
我々は、LiDARナビゲーション、未ペア画像翻訳、セルラーダイナミクスのモデリングなど、一連の課題でFMをテストする。
論文 参考訳(メタデータ) (2024-05-23T16:48:06Z) - Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian
Mixture Models [59.331993845831946]
拡散モデルは、所望の特性に向けてサンプル生成を操るために、スコア関数にタスク固有の情報を注入することの恩恵を受ける。
本稿では,ガウス混合モデルの文脈における拡散モデルに対する誘導の影響を理解するための最初の理論的研究を提供する。
論文 参考訳(メタデータ) (2024-03-03T23:15:48Z) - Scaling Riemannian Diffusion Models [68.52820280448991]
非自明な多様体上の高次元タスクにスケールできることを示す。
我々は、$SU(n)$格子上のQCD密度と高次元超球面上の対照的に学習された埋め込みをモデル化する。
論文 参考訳(メタデータ) (2023-10-30T21:27:53Z) - Diffusion Models are Minimax Optimal Distribution Estimators [49.47503258639454]
拡散モデリングの近似と一般化能力について、初めて厳密な分析を行った。
実密度関数がベソフ空間に属し、経験値整合損失が適切に最小化されている場合、生成したデータ分布は、ほぼ最小の最適推定値が得られることを示す。
論文 参考訳(メタデータ) (2023-03-03T11:31:55Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Geometric Scattering on Measure Spaces [15.819230791757906]
測度空間上での幾何散乱の一般統一モデルを導入する。
未知多様体をランダムにサンプリングして得られる有限測度空間を考える。
本稿では, 関連するグラフ散乱変換が基礎多様体上の散乱変換を近似するデータ駆動グラフを構築するための2つの方法を提案する。
論文 参考訳(メタデータ) (2022-08-17T22:40:09Z) - Mean-field Variational Inference via Wasserstein Gradient Flow [8.05603983337769]
平均場(MF)近似のような変分推論は、効率的な計算のためにある種の共役構造を必要とする。
We introduced a general computer framework to implement MFal inference for Bayesian model with or without latent variables, using the Wasserstein gradient flow (WGF)。
本稿では,ニューラルネットワークを用いた制約のない関数近似手法を提案する。
論文 参考訳(メタデータ) (2022-07-17T04:05:32Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Cycle Consistent Probability Divergences Across Different Spaces [38.43511529063335]
確率分布の相違は、統計的推測と機械学習の核心にある。
本研究は, 異方性, 異方性, 異方性, 異なる空間上の分布をマッチングするための, アンバランスなモンジュ最適輸送定式化を提案する。
論文 参考訳(メタデータ) (2021-11-22T16:35:58Z) - A Unifying and Canonical Description of Measure-Preserving Diffusions [60.59592461429012]
ユークリッド空間における測度保存拡散の完全なレシピは、最近、いくつかのMCMCアルゴリズムを単一のフレームワークに統合した。
我々は、この構成を任意の多様体に改善し一般化する幾何学理論を開発する。
論文 参考訳(メタデータ) (2021-05-06T17:36:55Z) - AI Giving Back to Statistics? Discovery of the Coordinate System of
Univariate Distributions by Beta Variational Autoencoder [0.0]
本稿では、単変量経験分布を分類し、累積分布関数(CDF)の入力に基づいて2次元の潜伏空間で表現するためのニューラルネットワークのトレーニング経験について論じる。
潜在2次元座標系上の表現は、CDFの形状、基礎となる理論分布とそのパラメータの分類確率、情報エントロピー、歪みなど、重要な分布特性を乱す実世界のデータの付加メタデータと見なすことができる。
論文 参考訳(メタデータ) (2020-04-06T14:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。