Fugu-MT 論文翻訳(概要): ControlVAE: Controllable Variational Autoencoder

論文の概要: ControlVAE: Controllable Variational Autoencoder

arxiv url: http://arxiv.org/abs/2004.05988v5
Date: Sat, 20 Jun 2020 20:21:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-13 23:26:47.650972
Title: ControlVAE: Controllable Variational Autoencoder
Title（参考訳）: ControlVAE: 可変変分オートエンコーダ
Authors: Huajie Shao, Shuochao Yao, Dachun Sun, Aston Zhang, Shengzhong Liu, Dongxin Liu, Jun Wang, Tarek Abdelzaher
Abstract要約: 変分オートエンコーダ(VAE)は、ダイアログ生成、画像生成、非絡み合い表現学習など、様々な用途で広く使われている。 ControlVAEは自動制御理論にインスパイアされたコントローラと基本的なVAEを組み合わせることで、生成モデルの性能を向上させる。
参考スコア（独自算出の注目度）: 16.83870832766681
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Variational Autoencoders (VAE) and their variants have been widely used in a variety of applications, such as dialog generation, image generation and disentangled representation learning. However, the existing VAE models have some limitations in different applications. For example, a VAE easily suffers from KL vanishing in language modeling and low reconstruction quality for disentangling. To address these issues, we propose a novel controllable variational autoencoder framework, ControlVAE, that combines a controller, inspired by automatic control theory, with the basic VAE to improve the performance of resulting generative models. Specifically, we design a new non-linear PI controller, a variant of the proportional-integral-derivative (PID) control, to automatically tune the hyperparameter (weight) added in the VAE objective using the output KL-divergence as feedback during model training. The framework is evaluated using three applications; namely, language modeling, disentangled representation learning, and image generation. The results show that ControlVAE can achieve better disentangling and reconstruction quality than the existing methods. For language modelling, it not only averts the KL-vanishing, but also improves the diversity of generated text. Finally, we also demonstrate that ControlVAE improves the reconstruction quality of generated images compared to the original VAE.
Abstract（参考訳）: 変分オートエンコーダ(VAE)とその変種は、ダイアログ生成、画像生成、非絡み合い表現学習など、様々な用途で広く使われている。しかしながら、既存のVAEモデルは異なるアプリケーションにいくつかの制限がある。例えば、vaeは、言語モデリングにおけるklの消失や、逆エンタングのための低コンストラクション品質に苦しむ。そこで本研究では,自動制御理論にインスパイアされたコントローラと,生成モデルの性能向上のための基本vaeを組み合わせた,新しい制御可能な変分オートエンコーダフレームワークであるcontrolvaeを提案する。具体的には、比例積分微分(PID)制御の変種である非線形PIコントローラを設計し、モデルトレーニング中に出力KL偏差をフィードバックとしてVAE目標に付加されたハイパーパラメータ(重み)を自動的に調整する。このフレームワークは3つのアプリケーション、すなわち言語モデリング、不整合表現学習、画像生成を用いて評価される。以上の結果から,コントロールVAEは既存の手法よりもディエンタングやリコンストラクションの質を向上できることがわかった。言語モデリングでは、KLの消滅を回避できるだけでなく、生成されたテキストの多様性も向上する。最後に,制御VAEが生成した画像の復元品質を,元のVAEと比較して向上させることを示す。

関連論文リスト

ScaleWeaver: Weaving Efficient Controllable T2I Generation with Multi-Scale Reference Attention [86.93601565563954]
ScaleWeaverは、高度な視覚的自己回帰(VAR)モデルに基づいて、高忠実で制御可能な生成を実現するために設計されたフレームワークである。提案された参照注意モジュールは image$rightarrow$condition から不要な注意を排除し、計算コストを削減している。実験によると、ScaleWeaverは、拡散ベースの方法よりも優れた効率を実現しつつ、高品質な生成と正確な制御を提供する。
論文参考訳（メタデータ） (2025-10-16T17:00:59Z)
Improved Representation Steering for Language Models [50.86411958644953]
我々は新しいReference-free Preference Steering (RePS)を通して表現ステアリングを改善する方法を示す。 2Bから27Bまでのサイズを持つGemmaモデルでは、RePSは言語モデリングの目的で訓練された既存のステアリングメソッドよりも優れています。抑圧においては、RePSはGemma-2の言語モデリングの目的と一致し、より大きなGemma-3の変種よりも優れている。
論文参考訳（メタデータ） (2025-05-27T07:16:40Z)
Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。私たちのフレームワークは、3つの新しい目標のファミリーにつながります。 Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文参考訳（メタデータ） (2024-10-10T17:18:30Z)
CAR: Controllable Autoregressive Modeling for Visual Generation [100.33455832783416]
Controllable AutoRegressive Modeling (CAR)は、条件制御をマルチスケールの潜在変数モデリングに統合する新しいプラグイン・アンド・プレイフレームワークである。 CARは、制御表現を徐々に洗練し、キャプチャし、前訓練されたモデルの各自己回帰ステップに注入して生成プロセスを導く。提案手法は,様々な条件にまたがって優れた制御性を示し,従来の手法に比べて画質の向上を実現している。
論文参考訳（メタデータ） (2024-10-07T00:55:42Z)
Show-o: One Single Transformer to Unify Multimodal Understanding and Generation [71.24909962718128]
マルチモーダル理解と生成を統一する統一変換器,すなわちShow-oを提案する。完全自己回帰モデルとは異なり、Show-oは自己回帰と(離散的な)拡散モデリングを統一し、様々な混合モダリティの入力と出力を適応的に処理する。
論文参考訳（メタデータ） (2024-08-22T16:32:32Z)
ControlVAR: Exploring Controllable Visual Autoregressive Modeling [48.66209303617063]
拡散モデル(DM)の出現により、条件付き視覚発生は顕著に進展した。高価な計算コスト、高い推論遅延、大規模言語モデル(LLM)との統合の難しさといった課題は、DMに代わる方法を模索する必要がある。本稿では,フレキシブルかつ効率的な条件生成のための視覚自己回帰モデリングにおける画素レベル制御を探求する新しいフレームワークであるControlmoreを紹介する。
論文参考訳（メタデータ） (2024-06-14T06:35:33Z)
LlaMaVAE: Guiding Large Language Model Generation via Continuous Latent Sentence Spaces [1.529963465178546]
本稿では,表現型エンコーダモデルとデコーダモデル(SentenceT5,LlaMA)とVAEアーキテクチャを組み合わせたLlaMaVAEを提案する。実験の結果、LlaMaVAEは従来の最先端のVAE言語モデルであるOptimusよりも、様々なタスクで優れていることがわかった。
論文参考訳（メタデータ） (2023-12-20T17:25:23Z)
Composing Ensembles of Pre-trained Models via Iterative Consensus [95.10641301155232]
本稿では,異なる事前学習モデルのアンサンブルを構成するための統一的なフレームワークを提案する。事前学習したモデルを「ジェネレータ」あるいは「スコーラ」として使用し、クローズドループ反復コンセンサス最適化により構成する。スコアラーのアンサンブルによって達成されたコンセンサスは、シングルスコアラーのフィードバックよりも優れていることを示す。
論文参考訳（メタデータ） (2022-10-20T18:46:31Z)
Multimodal VAE Active Inference Controller [0.0]
本稿では,産業用アームのアクティブ推論トルク制御装置を提案する。線形結合型マルチモーダル変分オートエンコーダを用いたマルチモーダル状態表現学習を含む。結果は、表現力の増加による目標方向到達の追跡と制御の改善を示した。
論文参考訳（メタデータ） (2021-03-07T18:00:27Z)
Transformer-based Conditional Variational Autoencoder for Controllable Story Generation [39.577220559911055]
ニューラルストーリー生成のための大規模潜時変数モデル (LVM) を, 生成効率と制御性という2つのスレッドで検討した。我々は、トランスフォーマーの時代において、本質的に表現学習の力である潜在変数モデリングを復活させることを提唱する。具体的には,遅延表現ベクトルをTransformerベースの事前学習アーキテクチャと統合し,条件付き変分オートエンコーダ(CVAE)を構築する。
論文参考訳（メタデータ） (2021-01-04T08:31:11Z)
ControlVAE: Tuning, Analytical Properties, and Performance Analysis [14.272917020105147]
ControlVAEは、新しい変分自動エンコーダフレームワークである。 VAEモデルのKL分割を所定の値に安定化する。復元品質とKL分割の良好なトレードオフを達成することができる。
論文参考訳（メタデータ） (2020-10-31T12:32:39Z)
Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文参考訳（メタデータ） (2020-07-17T21:50:35Z)
Simple and Effective VAE Training with Calibrated Decoders [123.08908889310258]
変分オートエンコーダ(VAE)は、複雑な分布をモデル化するための効果的で簡単な方法である。復号分布の不確かさを学習する校正復号器の影響について検討する。本稿では,一般的なガウス復号器の簡易かつ斬新な修正を提案し,その予測分散を解析的に計算する。
論文参考訳（メタデータ） (2020-06-23T17:57:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。