Fugu-MT 論文翻訳(概要): Linear combinations of Gaussian latents in generative models: interpolation and beyond

論文の概要: Linear combinations of Gaussian latents in generative models: interpolation and beyond

arxiv url: http://arxiv.org/abs/2408.08558v2
Date: Wed, 9 Oct 2024 18:39:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-08 07:18:07.278257
Title: Linear combinations of Gaussian latents in generative models: interpolation and beyond
Title（参考訳）: 生成モデルにおけるガウス潜伏剤の線形結合:補間とそれ以上
Authors: Erik Bodin, Carl Henrik Ek, Henry Moss,
Abstract要約: ガウス変数の組合せ(COG)は、実装が容易でありながら最近の高度な手法よりも優れている汎用手法である。 COGは、潜在変数の一般線型結合を形成するというより広範なタスクに自然に対処し、潜在空間の部分空間の構築を可能にする。
参考スコア（独自算出の注目度）: 6.38754204972456
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Sampling from generative models has become a crucial tool for applications like data synthesis and augmentation. Diffusion, Flow Matching and Continuous Normalizing Flows have shown effectiveness across various modalities, and rely on Gaussian latent variables for generation. For search-based or creative applications that require additional control over the generation process, it has become common to manipulate the latent variable directly. However, existing approaches for performing such manipulations (e.g. interpolation or forming low-dimensional representations) only work well in special cases or are network or data-modality specific. We propose Combination of Gaussian variables (COG) as a general purpose interpolation method that is easy to implement yet outperforms recent sophisticated methods. Moreover, COG naturally addresses the broader task of forming general linear combinations of latent variables, allowing the construction of subspaces of the latent space, dramatically simplifying the creation of expressive low-dimensional spaces of high-dimensional objects.
Abstract（参考訳）: 生成モデルからのサンプリングは、データ合成や拡張といったアプリケーションにとって重要なツールとなっている。拡散、フローマッチング、連続正規化フローは様々なモードで有効性を示し、生成にはガウス潜在変数に依存している。生成プロセスのさらなる制御を必要とする検索ベースアプリケーションやクリエイティブアプリケーションでは、潜伏変数を直接操作することが一般的になっている。しかし、そのような操作を行う既存のアプローチ(例えば、補間や低次元表現の形成)は、特別なケースでのみうまく機能するか、ネットワークやデータモダリティに特化している。本稿では, ガウス変数(COG)の組み合わせを, 実装が容易な汎用補間法として提案する。さらに、COGは、潜在変数の一般線型結合を形成するというより広範なタスクに対処し、潜在空間の部分空間の構築を可能にし、高次元オブジェクトの表現的低次元空間の作成を劇的に単純化する。

関連論文リスト

Geometric Regularity in Deterministic Sampling of Diffusion-based Generative Models [39.94246633953425]
決定論的サンプリング力学における顕著な幾何学的規則性を明らかにする。すべての軌道は、モデルアーキテクチャ、適用条件、生成された内容に関わらず、ほぼ同じ「ボメラン」形状を示す。提案手法は,サンプリング時間スケジュールと基礎となる軌道構造との整合性を向上する動的プログラミングに基づくスキームを提案する。
論文参考訳（メタデータ） (2025-06-11T21:09:09Z)
Efficient Flow Matching using Latent Variables [3.5817637191799605]
我々は、マルチモーダルデータ構造を組み込むための簡易なトレーニング/推論戦略を提供する、$textttLatent-CFM$を提示する。 textttLatent-CFM$は、トレーニングを著しく減らして、生成品質が向上していることを示す。
論文参考訳（メタデータ） (2025-05-07T14:59:23Z)
Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling [22.256068524699472]
本研究では,これらの問題に対処するために,Annealed Importance Smpling (AIS)アプローチを提案する。シークエンシャルモンテカルロサンプリング器とVIの強度を組み合わせることで、より広い範囲の後方分布を探索し、徐々にターゲット分布に接近する。実験結果から,本手法はより厳密な変動境界,高い対数類似度,より堅牢な収束率で最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2024-08-13T08:09:05Z)
Trivialized Momentum Facilitates Diffusion Generative Modeling on Lie Groups [37.78638937228254]
本稿では、自明化と呼ばれる手法がユークリッド空間における拡散モデルの有効性をリー群に伝達する方法を示す。モーメント変数は、データ分布と固定されたサンプル分布の間の位置変数の移動を支援するためにアルゴリズムによって導入された。得られた方法は、タンパク質およびRNAのねじれ角の生成および洗練されたトーラスデータセットに対する最先端の性能を達成する。
論文参考訳（メタデータ） (2024-05-25T23:53:07Z)
On the Trajectory Regularity of ODE-based Diffusion Sampling [79.17334230868693]
拡散に基づく生成モデルは微分方程式を用いて、複素データ分布と抽出可能な事前分布の間の滑らかな接続を確立する。本稿では,拡散モデルのODEに基づくサンプリングプロセスにおいて,いくつかの興味深い軌道特性を同定する。
論文参考訳（メタデータ） (2024-05-18T15:59:41Z)
Combining additivity and active subspaces for high-dimensional Gaussian process modeling [2.7140711924836816]
本稿では,高次元ガウス過程モデリングと多面性戦略を組み合わせる方法について述べる。高次元ガウス過程モデリングへの我々の貢献は、これらを多面的戦略と組み合わせ、合成関数やデータセットの実験を通じて利点を示すことである。
論文参考訳（メタデータ） (2024-02-06T08:49:27Z)
Dynamic Kernel-Based Adaptive Spatial Aggregation for Learned Image Compression [63.56922682378755]
本稿では,空間アグリゲーション機能の拡張に焦点をあて,動的カーネルベースの変換符号化を提案する。提案したアダプティブアグリゲーションはカーネルオフセットを生成し、コンテント条件付き範囲の有効な情報をキャプチャして変換を支援する。実験により,本手法は,最先端の学習手法と比較して,3つのベンチマークにおいて高い速度歪み性能が得られることを示した。
論文参考訳（メタデータ） (2023-08-17T01:34:51Z)
Improving Out-of-Distribution Robustness of Classifiers via Generative Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文参考訳（メタデータ） (2023-07-23T03:53:53Z)
Latent Dynamical Implicit Diffusion Processes [0.0]
潜在動的暗黙拡散過程(LDIDP)と呼ばれる新しい潜時変動モデルを提案する。 LDIDPは暗黙の拡散過程を利用して動的潜伏過程からサンプリングし、それに従って逐次観測サンプルを生成する。我々は, LDIDP が潜在次元上の力学を正確に学習できることを実証した。
論文参考訳（メタデータ） (2023-06-12T12:43:27Z)
VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2023-04-03T13:13:19Z)
DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文参考訳（メタデータ） (2023-01-23T15:18:54Z)
High-Dimensional Undirected Graphical Models for Arbitrary Mixed Data [2.2871867623460207]
多くのアプリケーションでは、データは異なるタイプの変数にまたがる。最近の進歩は、バイナリ連続ケースにどのように取り組めるかを示しているが、一般的な混合変数型構造は依然として困難である。完全混合型の変数を持つデータに対して,フレキシブルでスケーラブルな手法を提案する。
論文参考訳（メタデータ） (2022-11-21T18:21:31Z)
Multimodal hierarchical Variational AutoEncoders with Factor Analysis latent space [45.418113011182186]
本研究では,変分オートエンコーダ(VAE)と因子解析潜時空間(FA-VAE)を組み合わせることで,制約に対処する新しい手法を提案する。 FA-VAE法は複数のVAEを用いて連続潜伏空間における各異種データビューのプライベート表現を学習する。
論文参考訳（メタデータ） (2022-07-19T10:46:02Z)
Conditional Generative Modeling via Learning the Latent Space [54.620761775441046]
マルチモーダル空間における条件生成のための新しい枠組みを提案する。潜在変数を使って一般化可能な学習パターンをモデル化する。推論では、潜伏変数は複数の出力モードに対応する最適解を見つけるために最適化される。
論文参考訳（メタデータ） (2020-10-07T03:11:34Z)
Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-07-13T18:05:36Z)
Improve Variational Autoencoder for Text Generationwith Discrete Latent Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。 VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文参考訳（メタデータ） (2020-04-22T14:41:37Z)
Gaussianization Flows [113.79542218282282]
そこで本研究では,サンプル生成における効率のよい繰り返しと効率のよい逆変換を両立できる新しい型正規化フローモデルを提案する。この保証された表現性のため、サンプル生成の効率を損なうことなく、マルチモーダルなターゲット分布をキャプチャできる。
論文参考訳（メタデータ） (2020-03-04T08:15:06Z)
Modeling Continuous Stochastic Processes with Dynamic Normalizing Flows [40.9137348900942]
ウィナー過程の微分変形によって駆動される新しいタイプの流れを提案する。その結果,観測可能なプロセスが基本プロセスの魅力的な特性の多くを継承するリッチ時系列モデルが得られた。
論文参考訳（メタデータ） (2020-02-24T20:13:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。