論文の概要: Cross-Fusion Distance: A Novel Metric for Measuring Fusion and Separability Between Data Groups in Representation Space
- arxiv url: http://arxiv.org/abs/2601.22036v1
- Date: Thu, 29 Jan 2026 17:41:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:50.053171
- Title: Cross-Fusion Distance: A Novel Metric for Measuring Fusion and Separability Between Data Groups in Representation Space
- Title(参考訳): クロスフュージョン距離:表現空間におけるデータグループ間の融合と分離性を測定する新しい尺度
- Authors: Xiaolong Zhang, Jianwei Zhang, Xubo Song,
- Abstract要約: 我々は,融合保存変動に頑健でありながら,融合変分を分離する原理的尺度であるCross-Fusion Distance(CFD)を導入する。
ドメインシフトを伴う実世界のデータセットの実用性のために、CFDは一般的に使われる代替よりも下流の劣化一般化と密接に一致している。
- 参考スコア(独自算出の注目度): 4.8590246014520115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quantifying degrees of fusion and separability between data groups in representation space is a fundamental problem in representation learning, particularly under domain shift. A meaningful metric should capture fusion-altering factors like geometric displacement between representation groups, whose variations change the extent of fusion, while remaining invariant to fusion-preserving factors such as global scaling and sampling-induced layout changes, whose variations do not. Existing distributional distance metrics conflate these factors, leading to measures that are not informative of the true extent of fusion between data groups. We introduce Cross-Fusion Distance (CFD), a principled measure that isolates fusion-altering geometry while remaining robust to fusion-preserving variations, with linear computational complexity. We characterize the invariance and sensitivity properties of CFD theoretically and validate them in controlled synthetic experiments. For practical utility on real-world datasets with domain shift, CFD aligns more closely with downstream generalization degradation than commonly used alternatives. Overall, CFD provides a theoretically grounded and interpretable distance measure for representation learning.
- Abstract(参考訳): 表現空間におけるデータグループ間の融合度と分離性の定量化は、特にドメインシフトの下で、表現学習の基本的な問題である。
意味のある計量は、拡散の程度が変化する表現群間の幾何変位のような融合変化因子を捉えるが、大域的スケーリングやサンプリングによって誘導されるレイアウト変化のような融合保存因子に変わらず、変化は起こらない。
既存の分布距離測定ではこれらの要因が明確化されており、データグループ間の融合の真の範囲を知らせるものではない。
我々は, 融合保存変動に頑健でありながら, 線形計算複雑性を保ちながら, 融合変分幾何を分離する原理的尺度であるCross-Fusion Distance(CFD)を紹介する。
CFDの不均一性と感度特性を理論的に評価し, 制御された合成実験において評価した。
ドメインシフトを伴う実世界のデータセットの実用性のために、CFDは一般的に使われる代替手段よりも下流の一般化劣化と密接に一致している。
全体として、CFDは表現学習のための理論的基礎と解釈可能な距離尺度を提供する。
関連論文リスト
- Geometric Decomposition of Statistical Inference through Gradient Flow and Co-Monotonicity Measures [0.0]
地域分析に推論問題を分割するための2つの戦略を提供する幾何学的分解フレームワークを開発する。
経路単調性検証離散モース理論を用いてサンプルを勾配流セルに分割し,結果が単調な振る舞いを示す。
共単調性分解は結合構造を利用し、サンプルの結合空間への埋め込みを定義する。
論文 参考訳(メタデータ) (2025-11-06T17:51:32Z) - Learning over von Mises-Fisher Distributions via a Wasserstein-like Geometry [0.0]
我々は、フォン・ミセス・フィッシャー(vMF)分布の族に対する幾何対応距離計量を導入する。
最適輸送の理論により、2つの vMF 分布間の相違を2つの解釈可能な成分に分解するワッサーシュタインのような距離を提案する。
論文 参考訳(メタデータ) (2025-04-19T03:38:15Z) - Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - Cross-Dataset Gaze Estimation by Evidential Inter-intra Fusion [38.93368421481945]
クロスデータセットモデルをトレーニングするための新しいEvidential Inter-Intra Fusion EIFフレームワークを提案する。
さまざまなデータセットに対して独立した単一データセットのブランチを構築します。
さらに、単一データセットのブランチから一般化可能な機能を統合するために、クロスデータセットのブランチを作成します。
論文 参考訳(メタデータ) (2024-09-07T08:53:17Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Measuring dissimilarity with diffeomorphism invariance [94.02751799024684]
DID(DID)は、幅広いデータ空間に適用可能なペアワイズな相似性尺度である。
我々は、DIDが理論的研究と実用に関係のある特性を享受していることを証明する。
論文 参考訳(メタデータ) (2022-02-11T13:51:30Z) - Inverse Learning of Symmetries [71.62109774068064]
2つの潜在部分空間からなるモデルで対称性変換を学ぶ。
我々のアプローチは、情報ボトルネックと連続的な相互情報正規化器の組み合わせに基づいています。
我々のモデルは, 人工的および分子的データセットにおける最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-02-07T13:48:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。