論文の概要: Semi-Supervised Generative Learning via Latent Space Distribution Matching
- arxiv url: http://arxiv.org/abs/2603.04223v1
- Date: Wed, 04 Mar 2026 16:06:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.392303
- Title: Semi-Supervised Generative Learning via Latent Space Distribution Matching
- Title(参考訳): 潜在空間分布マッチングによる半教師付き生成学習
- Authors: Kwong Yu Chong, Long Feng,
- Abstract要約: 条件分布の半教師付き生成モデリングのための新しいフレームワークであるLatent Space Distribution Matching (LSDM)を紹介した。
LSDMは、(i)ペアデータと未ペアデータの両方から低次元の潜在空間を学習し、(ii)1-ワッサーシュタイン距離を介して、この空間で共同分布マッチングを行う。
- 参考スコア(独自算出の注目度): 3.300559069009268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Latent Space Distribution Matching (LSDM), a novel framework for semi-supervised generative modeling of conditional distributions. LSDM operates in two stages: (i) learning a low-dimensional latent space from both paired and unpaired data, and (ii) performing joint distribution matching in this space via the 1-Wasserstein distance, using only paired data. This two-step approach minimizes an upper bound on the 1-Wasserstein distance between joint distributions, reducing reliance on scarce paired samples while enabling fast one-step generation. Theoretically, we establish non-asymptotic error bounds and demonstrate a key benefit of unpaired data: enhanced geometric fidelity in generated outputs. Furthermore, by extending the scope of its two core steps, LSDM provides a coherent statistical perspective that connects to a broad class of latent-space approaches. Notably, Latent Diffusion Models (LDMs) can be viewed as a variant of LSDM, in which joint distribution matching is achieved indirectly via score matching. Consequently, our results also provide theoretical insights into the consistency of LDMs. Empirical evaluations on real-world image tasks, including class-conditional generation and image super-resolution, demonstrate the effectiveness of LSDM in leveraging unpaired data to enhance generation quality.
- Abstract(参考訳): 条件分布の半教師付き生成モデリングのための新しいフレームワークであるLatent Space Distribution Matching (LSDM)を紹介した。
LSDMは以下の2段階で動作する。
(i)ペアデータとペアデータの両方から低次元潜在空間を学習し、
2) この空間において, ペアデータのみを用いて, 1-ワッサーシュタイン距離を用いて共同分布マッチングを行う。
この2段階のアプローチは、関節分布間の1-ワッサーシュタイン距離の上限を最小化し、少ないペアのサンプルへの依存を減らし、高速なワンステップ生成を可能にする。
理論的には、非漸近誤差境界を確立し、未ペアデータの重要な利点を実証する。
さらに、LSDMはその2つの中核ステップの範囲を広げることで、幅広い潜在空間のアプローチに結びつくコヒーレントな統計的視点を提供する。
特に、Latent Diffusion Models (LDMs) はLSDMの変種と見なすことができる。
その結果, LDMの整合性に関する理論的知見も得られた。
クラス条件生成や画像超解像を含む実世界の画像タスクに関する実証的評価は、未ペアデータを利用して生成品質を向上させるLSDMの有効性を実証する。
関連論文リスト
- Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - Wasserstein Convergence of Score-based Generative Models under Semiconvexity and Discontinuous Gradients [3.007949058551534]
スコアベース生成モデル(SGM)は、ガウス雑音で摂動させ、学習された拡散過程を通じてデノベーションすることで、データ分布を近似する。
我々は、潜在的に不連続な勾配を持つ半1次を対象とするSGMに対して、最初の非同相なワッサーシュタイン-2収束保証を確立する。
論文 参考訳(メタデータ) (2025-05-06T11:17:15Z) - Enhanced High-Dimensional Data Visualization through Adaptive Multi-Scale Manifold Embedding [0.7705234721762716]
本稿では,適応型マルチスケールマニフォールド埋め込み (AMSME) アルゴリズムを提案する。
順序距離を導入することで、高次元空間における次元性の呪いの制約を克服できることが示される。
実験により,AMSMEはクラスタ内トポロジ構造を著しく保存し,クラスタ間分離を改善した。
論文 参考訳(メタデータ) (2025-03-18T06:46:53Z) - Dataset Condensation with Latent Quantile Matching [5.466962214217334]
電流分布マッチング (DM) に基づく直流法は, 合成外乱と実外乱の遅延埋め込みの平均をマッチングすることにより, 合成データセットを学習する。
本稿では,2つの分布間の適合試験統計量の良さを最小化するために,遅延埋め込みの量子化と一致する潜在量子マッチング(LQM)を提案する。
論文 参考訳(メタデータ) (2024-06-14T09:20:44Z) - Deep Generative Sampling in the Dual Divergence Space: A Data-efficient & Interpretative Approach for Generative AI [29.13807697733638]
自然画像の生成的サンプリングにおける顕著な成果の上に構築する。
我々は、画像に似たサンプルを生成するという、画期的な挑戦を、潜在的に過度に野心的に提案する。
統計上の課題は、小さなサンプルサイズであり、時には数百人の被験者で構成されている。
論文 参考訳(メタデータ) (2024-04-10T22:35:06Z) - InterHandGen: Two-Hand Interaction Generation via Cascaded Reverse Diffusion [53.90516061351706]
両手インタラクションに先立って生成を学習する新しいフレームワークであるInterHandGenを提案する。
サンプリングにアンチペネティフィケーションと合成フリーガイダンスを組み合わせることで、プラウシブルな生成を可能にする。
本手法は, 妥当性と多様性の観点から, ベースライン生成モデルよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-03-26T06:35:55Z) - Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian
Mixture Models [59.331993845831946]
拡散モデルは、所望の特性に向けてサンプル生成を操るために、スコア関数にタスク固有の情報を注入することの恩恵を受ける。
本稿では,ガウス混合モデルの文脈における拡散モデルに対する誘導の影響を理解するための最初の理論的研究を提供する。
論文 参考訳(メタデータ) (2024-03-03T23:15:48Z) - Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-22T03:27:46Z) - Linking data separation, visual separation, and classifier performance
using pseudo-labeling by contrastive learning [125.99533416395765]
最終分類器の性能は、潜在空間に存在するデータ分離と、射影に存在する視覚的分離に依存すると論じる。
本研究は,ヒト腸管寄生虫の5つの現実的課題の画像データセットを1%の教師付きサンプルで分類し,その結果を実証する。
論文 参考訳(メタデータ) (2023-02-06T10:01:38Z) - Learning to Match Distributions for Domain Adaptation [116.14838935146004]
本稿では,ドメイン間分布マッチングを自動的に学習する学習 to Match (L2M)を提案する。
L2Mは、メタネットワークを用いてデータ駆動方式で分布整合損失を学習することにより、誘導バイアスを低減する。
公開データセットの実験は、SOTA法よりもL2Mの方が優れていることを裏付けている。
論文 参考訳(メタデータ) (2020-07-17T03:26:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。