論文の概要: Disentanglement Beyond Generative Models with Riemannian ICA
- arxiv url: http://arxiv.org/abs/2605.22531v1
- Date: Thu, 21 May 2026 14:22:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.580773
- Title: Disentanglement Beyond Generative Models with Riemannian ICA
- Title(参考訳): Riemannian ICAによる生成モデルを超えての遠絡
- Authors: Edmond Cunningham,
- Abstract要約: 我々は,グローバルな生成モデルを仮定することなく,局所的ゆがみを研究する理論的基盤を提供する。
我々の主な貢献は、二階の非絡みの概念を符号化する非絡みテンソルである。
- 参考スコア(独自算出の注目度): 1.3198689566654105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is a gap between the theoretical foundations of disentanglement and the practice of modern representation learning. Existing theoretical frameworks, particularly Independent Component Analysis (ICA) and its nonlinear variants, assume a generative model with statistically independent latent variables underlying the data so that disentanglement amounts to identifying the latents that could have generated the data. This generative framework is interpretable and theoretically justified, but its strong assumptions make it difficult to apply to modern representation learning. Modern pretrained encoders often learn features that exhibit disentangled properties without making generative assumptions, yet there is no general theory for interpreting these features as independent factors of variation. We take a step toward such a theory by introducing Riemannian ICA (RICA), which replaces ICA's global generative model with local geometric structure. RICA is founded on the observation that in ICA, the factors of variation underlying a data point can be understood through radial curves emanating from the point that map to axis-aligned lines in the latent space. We formalize this perspective using Riemannian geometry and introduce our theory in a way that is consistent with the existing generative approach. Our main contribution is the disentanglement tensor, which encodes a second-order notion of disentanglement that we call pointwise disentanglement. This tensor depends on the Hessian of the data log likelihood as well as the Ricci curvature induced by the model. In a controlled source recovery setting with known ground-truth sources, RICA recovers sources across several manifolds, while the success of ICA baselines depends on the coordinates used to represent the observations. Our work provides a theoretical basis for studying local disentanglement without assuming a global generative model.
- Abstract(参考訳): 絡み合いの理論的基礎と近代的な表現学習の実践の間にはギャップがある。
既存の理論フレームワーク、特に独立成分分析(ICA)とその非線形変種は、データに基づいて統計的に独立な潜伏変数を持つ生成モデルを仮定し、乱れがデータを生成する可能性のある潜伏変数を特定する。
この生成フレームワークは解釈可能で理論的に正当化されるが、その強い仮定は現代の表現学習に適用することが困難である。
現代の事前学習エンコーダは、しばしば、生成的仮定を作らずに絡み合った性質を示す特徴を学ぶが、これらの特徴を変動の独立した要因として解釈する一般的な理論は存在しない。
我々は、ICAの大域的生成モデルを局所幾何学構造に置き換えるリーマンICA(RICA)を導入することにより、そのような理論への一歩を踏み出した。
RICA は、ICA において、データ点の根底にある変化の要因は、ラテント空間内の軸方向の線に写像する点から発せられる半径曲線によって理解できるという観察に基づいている。
我々はリーマン幾何学を用いてこの視点を定式化し、既存の生成的アプローチと整合した方法で我々の理論を導入する。
我々の主な貢献は、遠絡テンソル(英語版)であり、これは、ポイントワイドな遠絡と呼ばれる2階の遠絡の概念をエンコードする。
このテンソルは、モデルによって誘導されるリッチ曲率と同様に、データログ確率のヘシアンに依存する。
RICAは複数の多様体のソースを復元するが、ICAベースラインの成功は観測を表わす座標に依存する。
我々の研究は、大域的な生成モデルを仮定することなく局所的ゆがみを研究する理論的基礎を提供する。
関連論文リスト
- On Higher-Order Geometric Refinements of Classical Covariance Asymptotics: An Approach via Intrinsic and Extrinsic Information Geometry [0.0]
混合、曲線指数族、潜在変数モデル、多様体-ルートパラメータ空間を含む曲線モデルでは、有限サンプルの振る舞いは予測から体系的に逸脱することができる。
我々は、正規パラメトリック族をフィッシャー制約ラオ計量の((,g))として見ることにより、座標不変な曲率対応の洗練を開発する。
本稿では,学習速度と後進平均二乗誤差における実対数正準しきい値の役割,および正規理論を特殊ケースとして回復する解空間上の曲率に基づく共分散展開について述べる。
論文 参考訳(メタデータ) (2026-04-14T13:40:13Z) - Learning Latent Graph Geometry via Fixed-Point Schrödinger-Type Activation: A Theoretical Study [1.1745324895296467]
我々は、学習された潜在グラフ上の散逸的シュリンガー型ダイナミクスの定常状態として内部表現が進化するニューラルアーキテクチャの統一的理論的枠組みを開発する。
我々は、平衡の存在、一意性、滑らかな依存を証明し、力学がノルム保存ランダウ-リフシッツ流にブロッホ写像の下で等価であることを示す。
結果として得られるモデルクラスは、固定点 Schr"odinger 型のアクティベーションを通して潜在グラフ幾何学を学ぶためのコンパクトで幾何学的に解釈可能で解析的に抽出可能な基礎を提供する。
論文 参考訳(メタデータ) (2025-07-27T00:35:15Z) - Wrapped Gaussian on the manifold of Symmetric Positive Definite Matrices [4.678796432640703]
円形および非平坦なデータ分布は、データ科学の様々な領域で広く使われている。
このようなデータの基盤となる幾何学を考慮に入れるための原則的なアプローチは、重要なものである。
この研究は、古典的な機械学習と統計手法をより複雑で構造化されたデータに拡張するための基礎となる。
論文 参考訳(メタデータ) (2025-02-03T16:46:46Z) - Nonparametric Partial Disentanglement via Mechanism Sparsity: Sparse
Actions, Interventions and Sparse Temporal Dependencies [58.179981892921056]
この研究は、メカニズムのスパーシティ正則化(英語版)と呼ばれる、アンタングルメントの新たな原理を導入する。
本稿では,潜在要因を同時に学習することで,絡み合いを誘発する表現学習手法を提案する。
学習した因果グラフをスパースに規則化することにより、潜伏因子を復元できることを示す。
論文 参考訳(メタデータ) (2024-01-10T02:38:21Z) - On the Joint Interaction of Models, Data, and Features [82.60073661644435]
本稿では,データとモデル間の相互作用を実験的に解析する新しいツールであるインタラクションテンソルを紹介する。
これらの観測に基づいて,特徴学習のための概念的枠組みを提案する。
この枠組みの下では、一つの仮説に対する期待された精度と一対の仮説に対する合意はどちらも閉形式で導出することができる。
論文 参考訳(メタデータ) (2023-06-07T21:35:26Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Discovering Latent Causal Variables via Mechanism Sparsity: A New
Principle for Nonlinear ICA [81.4991350761909]
ICA(Independent component analysis)は、この目的を定式化し、実用的な応用のための推定手順を提供する手法の集合を指す。
潜伏変数は、潜伏機構をスパースに正則化すれば、置換まで復元可能であることを示す。
論文 参考訳(メタデータ) (2021-07-21T14:22:14Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - Identifying the latent space geometry of network models through analysis
of curvature [7.644165047073435]
本稿では,可換空間の経験的に関連するクラスから多様体の種類,次元,曲率を一貫して推定する手法を提案する。
私たちのコアインサイトは、このグラフを、シリック間の結びつきに基づく騒々しい距離行列として表現することで実現します。
論文 参考訳(メタデータ) (2020-12-19T00:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。