論文の概要: Disentangled Representation Learning with the Gromov-Monge Gap
- arxiv url: http://arxiv.org/abs/2407.07829v2
- Date: Thu, 24 Oct 2024 16:49:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 22:40:08.296139
- Title: Disentangled Representation Learning with the Gromov-Monge Gap
- Title(参考訳): Gromov-Monge Gapを用いたアンタングル表現学習
- Authors: Théo Uscidda, Luca Eyring, Karsten Roth, Fabian Theis, Zeynep Akata, Marco Cuturi,
- Abstract要約: 乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
- 参考スコア(独自算出の注目度): 65.73194652234848
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning disentangled representations from unlabelled data is a fundamental challenge in machine learning. Solving it may unlock other problems, such as generalization, interpretability, or fairness. Although remarkably challenging to solve in theory, disentanglement is often achieved in practice through prior matching. Furthermore, recent works have shown that prior matching approaches can be enhanced by leveraging geometrical considerations, e.g., by learning representations that preserve geometric features of the data, such as distances or angles between points. However, matching the prior while preserving geometric features is challenging, as a mapping that fully preserves these features while aligning the data distribution with the prior does not exist in general. To address these challenges, we introduce a novel approach to disentangled representation learning based on quadratic optimal transport. We formulate the problem using Gromov-Monge maps that transport one distribution onto another with minimal distortion of predefined geometric features, preserving them as much as can be achieved. To compute such maps, we propose the Gromov-Monge-Gap (GMG), a regularizer quantifying whether a map moves a reference distribution with minimal geometry distortion. We demonstrate the effectiveness of our approach for disentanglement across four standard benchmarks, outperforming other methods leveraging geometric considerations.
- Abstract(参考訳): 乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
これを解決することで、一般化、解釈可能性、公平性といった他の問題を解き放つことができる。
理論上は解くのは非常に難しいが、実際には事前マッチングによって解離が達成されることが多い。
さらに、最近の研究では、例えば、点間の距離や角度など、データの幾何学的特徴を保存することによる学習により、幾何学的考察を活用することで、事前マッチングアプローチを向上できることが示されている。
しかし、これらの特徴を完全に保存し、データ分布を前と整合させるマッピングは一般に存在しないため、幾何学的特徴を保存しながら前と一致させることは困難である。
これらの課題に対処するために,2次最適輸送に基づく非交叉表現学習手法を提案する。
我々は、Gromov-Monge マップを用いて、あらかじめ定義された幾何学的特徴の歪みを最小限に抑えながら、ある分布を別の分布へ輸送する問題を定式化する。
このような写像を計算するために,地図が最小の幾何歪みで基準分布を移動するかどうかを定量化する正規化器であるGromov-Monge-Gap (GMG)を提案する。
提案手法の有効性を4つの標準ベンチマークで示すとともに,幾何学的考察を生かした他の手法よりも優れていることを示す。
関連論文リスト
- Geometrically Aligned Transfer Encoder for Inductive Transfer in
Regression Tasks [5.038936775643437]
微分幾何学に基づく新しい移動法,すなわち幾何学的配向変換(GATE)を提案する。
すべての任意の点が重なり合う領域の局所平坦な座標に写像されることを保証するために、タスクのペア間の適切な微分同相性を見つけ、ソースからターゲットデータへの知識の伝達を可能にする。
GATEは従来の手法より優れ、様々な分子グラフデータセットの潜伏空間と外挿領域の両方で安定した振る舞いを示す。
論文 参考訳(メタデータ) (2023-10-10T07:11:25Z) - Joint graph learning from Gaussian observations in the presence of
hidden nodes [26.133725549667734]
本稿では,隠れ変数の存在を考慮した共同グラフ学習法を提案する。
従来の考察から得られた構造を利用して凸最適化問題を提案する。
提案したアルゴリズムを異なるベースラインで比較し、合成グラフと実世界のグラフ上での性能を評価する。
論文 参考訳(メタデータ) (2022-12-04T13:03:41Z) - Unveiling the Sampling Density in Non-Uniform Geometric Graphs [69.93864101024639]
グラフを幾何学グラフとみなす: ノードは基礎となる計量空間からランダムにサンプリングされ、その距離が指定された近傍半径以下であれば任意のノードが接続される。
ソーシャルネットワークでは、コミュニティは密集したサンプル領域としてモデル化でき、ハブはより大きな近傍半径を持つノードとしてモデル化できる。
我々は,未知のサンプリング密度を自己監督的に推定する手法を開発した。
論文 参考訳(メタデータ) (2022-10-15T08:01:08Z) - Geometry Contrastive Learning on Heterogeneous Graphs [50.58523799455101]
本稿では,幾何学コントラスト学習(Geometry Contrastive Learning, GCL)と呼ばれる,新しい自己指導型学習手法を提案する。
GCLはユークリッドと双曲的な視点からヘテロジニアスグラフを同時に見ることができ、リッチな意味論と複雑な構造をモデル化する能力の強い融合を目指している。
4つのベンチマークデータセットの大規模な実験は、提案手法が強いベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-25T03:54:53Z) - Semi-supervised Dense Keypoints Using Unlabeled Multiview Images [22.449168666514677]
本稿では,ラベルのないマルチビュー画像を用いて高密度なキーポイント検出器を学習するための,エンド・ツー・エンドの半教師付きフレームワークを提案する。
鍵となる課題は、複数のビューで密接なキーポイント間の正確な対応を見つけることである。
2つの望ましい性質を符号化する新しい確率的極性制約を導出する。
論文 参考訳(メタデータ) (2021-09-20T04:57:57Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-03-23T12:28:07Z) - Learning Flat Latent Manifolds with VAEs [16.725880610265378]
本稿では、ユークリッド計量がデータポイント間の類似性のプロキシとなる変分自動エンコーダのフレームワークの拡張を提案する。
我々は、変分オートエンコーダで一般的に使用されるコンパクトな以前のものを、最近発表されたより表現力のある階層型に置き換える。
提案手法は,ビデオ追跡ベンチマークを含む,さまざまなデータセットを用いて評価する。
論文 参考訳(メタデータ) (2020-02-12T09:54:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。