論文の概要: Fubini Study geometry of representation drift in high dimensional data
- arxiv url: http://arxiv.org/abs/2602.02596v1
- Date: Sun, 01 Feb 2026 16:00:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:14.96375
- Title: Fubini Study geometry of representation drift in high dimensional data
- Title(参考訳): フービニによる高次元データにおける表現流の幾何学
- Authors: Arturo Tozzi,
- Abstract要約: 高次元表現のドリフトは、ユークリッド距離またはコサイン距離を用いて一般的に定量化される。
フービニ・スタディ・メトリックスにおいて,表現漂流の射影幾何学的視点を導入する。
フービニ・スタディ(Fubini Study)測度は、ゲージ誘起揺らぎの下での残留不変量による内在的進化を分離することを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High dimensional representation drift is commonly quantified using Euclidean or cosine distances, which presuppose fixed coordinates when comparing representations across time, training or preprocessing stages. While effective in many settings, these measures entangle intrinsic changes in the data with variations induced by arbitrary parametrizations. We introduce a projective geometric view of representation drift grounded in the Fubini Study metric, which identifies representations that differ only by gauge transformations such as global rescalings or sign flips. Applying this framework to empirical high dimensional datasets, we explicitly construct representation trajectories and track their evolution through cumulative geometric drift. Comparing Euclidean, cosine and Fubini Study distances along these trajectories reveals that conventional metrics systematically overestimate change whenever representations carry genuine projective ambiguity. By contrast, the Fubini Study metric isolates intrinsic evolution by remaining invariant under gauge-induced fluctuations. We further show that the difference between cosine and Fubini Study drift defines a computable, monotone quantity that directly captures representation churn attributable to gauge freedom. This separation provides a diagnostic for distinguishing meaningful structural evolution from parametrization artifacts, without introducing model-specific assumptions. Overall, we establish a geometric criterion for assessing representation stability in high-dimensional systems and clarify the limits of angular distances. Embedding representation dynamics in projective space connects data analysis with established geometric programs and yields observables that are directly testable in empirical workflows.
- Abstract(参考訳): 高次元表現のドリフトはユークリッド距離またはコサイン距離を用いて一般的に定量化され、時間、訓練、または前処理段階における表現を比較する際に固定座標を前提とする。
多くの環境で有効であるが、これらの測定は任意のパラメトリゼーションによって引き起こされる変動を伴うデータの内在的な変化を絡み合わせる。
本研究では,大域的再スケーリングや符号フリップのようなゲージ変換によってのみ異なる表現を識別する,フビニ・スタディ・メトリックに基礎を置いている表現の射影幾何学的ドリフトについて紹介する。
このフレームワークを経験的高次元データセットに適用し、表現軌跡を明示的に構築し、累積幾何学的ドリフトを通してそれらの進化を追跡する。
ユークリッド、コサイン、フビニと比較すると、これらの軌道に沿った距離は、表現が真の射影的曖昧さを持つ場合、従来の指標が体系的に過大評価されていることを示している。
対照的に、フビニ・スタディ(Fubini Study)の計量は、ゲージ誘起の揺らぎの下での残留不変量による内在的進化を分離する。
さらに、コサインとフビニスタディのドリフトの違いは、自由度を測ることのできる表現チャーンを直接キャプチャする計算可能な単調量を定義することを示している。
この分離は、モデル固有の仮定を導入することなく、パラメトリゼーションアーティファクトから有意義な構造的進化を区別する診断を提供する。
全体として,高次元システムにおける表現安定性を評価するための幾何学的基準を確立し,角距離の限界を明らかにする。
射影空間における表現力学の埋め込みは、データ解析と確立された幾何学的プログラムを結びつけ、経験的ワークフローで直接テスト可能な可観測物を得る。
関連論文リスト
- Generative Modeling of Discrete Data Using Geometric Latent Subspaces [3.7015295923035705]
分類分布の積多様体の指数パラメータ空間における潜在部分空間の利用を紹介する。
低次元の潜在空間は統計的依存関係を符号化し、変数間の冗長な自由度を除去する。
その結果, 潜在次元の減少は, 生成モデルのためのデータを表現するのに十分であることがわかった。
論文 参考訳(メタデータ) (2026-01-29T15:14:15Z) - Scale-Consistent State-Space Dynamics via Fractal of Stationary Transformations [9.983526161001997]
最近のディープラーニングモデルは、中間表現の妥当性に関する構造的な保証なしに、ますます深度に依存している。
我々は、状態空間モデルのスケール一貫性潜在力学の構造的要件を定式化することにより、この制限に対処する。
我々は予測されたスケール一貫性の挙動を実証的に検証し、適応効率がアライメントされた潜在幾何学から現れることを示す。
論文 参考訳(メタデータ) (2026-01-27T12:44:20Z) - VIKING: Deep variational inference with stochastic projections [48.946143517489496]
変分平均場近似は、現代の過度にパラメータ化されたディープニューラルネットワークと競合する傾向がある。
パラメータ空間の2つの独立線型部分空間を考える単純な変分族を提案する。
これにより、オーバーパラメトリゼーションを反映した、完全に相関した近似後部を構築することができる。
論文 参考訳(メタデータ) (2025-10-27T15:38:35Z) - What's Inside Your Diffusion Model? A Score-Based Riemannian Metric to Explore the Data Manifold [0.053713376045563095]
スコアに基づくリーマン計量を導入し、データ多様体の内在幾何学を特徴づける。
我々のアプローチは、測地学が自然に多様体の輪郭に従う幾何学を生成する。
我々のスコアに基づく測地学は、基礎となるデータ分布を尊重する有意義な垂直変換を捉えていることを示す。
論文 参考訳(メタデータ) (2025-05-16T11:19:57Z) - Measuring Orthogonality in Representations of Generative Models [81.13466637365553]
教師なしの表現学習において、モデルは高次元データから低次元の学習表現に不可欠な特徴を蒸留することを目的としている。
独立した生成過程の切り離しは、長い間、高品質な表現を生み出してきた。
我々は、IWO(Importance-Weighted Orthogonality)とIWR(Importance-Weighted Rank)の2つの新しい指標を提案する。
論文 参考訳(メタデータ) (2024-07-04T08:21:54Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - Learning Disentangled Representations with Latent Variation
Predictability [102.4163768995288]
本稿では,潜在不整合表現の変動予測可能性について述べる。
逆生成プロセス内では、潜時変動と対応する画像対の相互情報を最大化することにより、変動予測可能性を高める。
本研究では,潜在表現の絡み合いを測るために,基礎的構造的生成因子に依存しない評価指標を開発する。
論文 参考訳(メタデータ) (2020-07-25T08:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。