論文の概要: Is Disentanglement enough? On Latent Representations for Controllable
Music Generation
- arxiv url: http://arxiv.org/abs/2108.01450v1
- Date: Sun, 1 Aug 2021 18:37:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-05 00:21:14.351467
- Title: Is Disentanglement enough? On Latent Representations for Controllable
Music Generation
- Title(参考訳): 絡み合いは十分か?
制御可能な音楽生成のための潜在表現について
- Authors: Ashis Pati, Alexander Lerch
- Abstract要約: 強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
- 参考スコア(独自算出の注目度): 78.8942067357231
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Improving controllability or the ability to manipulate one or more attributes
of the generated data has become a topic of interest in the context of deep
generative models of music. Recent attempts in this direction have relied on
learning disentangled representations from data such that the underlying
factors of variation are well separated. In this paper, we focus on the
relationship between disentanglement and controllability by conducting a
systematic study using different supervised disentanglement learning algorithms
based on the Variational Auto-Encoder (VAE) architecture. Our experiments show
that a high degree of disentanglement can be achieved by using different forms
of supervision to train a strong discriminative encoder. However, in the
absence of a strong generative decoder, disentanglement does not necessarily
imply controllability. The structure of the latent space with respect to the
VAE-decoder plays an important role in boosting the ability of a generative
model to manipulate different attributes. To this end, we also propose methods
and metrics to help evaluate the quality of a latent space with respect to the
afforded degree of controllability.
- Abstract(参考訳): 制御性の向上や、生成したデータの1つ以上の属性を操作する能力は、音楽の深い生成モデルという文脈における関心の対象となっている。
この方向の最近の試みは、変動の基盤となる要因が明確に分離されるように、データから絡み合った表現を学習することに依存している。
本稿では,変分オートエンコーダ(vae)アーキテクチャに基づく異なる教師付き異方性学習アルゴリズムを用いて系統的な学習を行い,異方性と制御性の関係に注目した。
実験により,強い識別エンコーダを訓練するために異なる形態の監督を用いることにより,高いディエンタグルメントを実現することができた。
しかし、強い生成デコーダが存在しない場合、絡み合いは必ずしも制御性を意味するとは限らない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
この目的のために我々は,許容範囲の制御性に関して,潜在空間の品質を評価するための方法や指標も提案する。
関連論文リスト
- Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Learning Action-based Representations Using Invariance [18.1941237781348]
我々は,制御に関係のある遠隔状態の特徴を割引する多段階制御可能性指標を学習するアクションビシミュレーション符号化を導入する。
我々は,報酬のない一様ランダムなデータに基づく行動ビシミュレーション事前学習が,複数の環境におけるサンプル効率を向上させることを実証した。
論文 参考訳(メタデータ) (2024-03-25T02:17:54Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Transformer-based Conditional Variational Autoencoder for Controllable
Story Generation [39.577220559911055]
ニューラルストーリー生成のための大規模潜時変数モデル (LVM) を, 生成効率と制御性という2つのスレッドで検討した。
我々は、トランスフォーマーの時代において、本質的に表現学習の力である潜在変数モデリングを復活させることを提唱する。
具体的には,遅延表現ベクトルをTransformerベースの事前学習アーキテクチャと統合し,条件付き変分オートエンコーダ(CVAE)を構築する。
論文 参考訳(メタデータ) (2021-01-04T08:31:11Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z) - Learning perturbation sets for robust machine learning [97.6757418136662]
我々は、潜在空間の制約領域上に設定された摂動を定義する条件生成器を用いる。
学習した摂動集合の質を定量的かつ質的に測定する。
我々は、学習した摂動集合を利用して、敵画像の破損や逆光の変動に対して経験的かつ確実に堅牢なモデルを訓練する。
論文 参考訳(メタデータ) (2020-07-16T16:39:54Z) - Guided Variational Autoencoder for Disentanglement Learning [79.02010588207416]
本稿では,潜在表現非絡み合い学習を行うことで,制御可能な生成モデルを学習できるアルゴリズム,Guided-VAEを提案する。
我々は、ガイド-VAEにおける教師なし戦略と教師なし戦略を設計し、バニラVAE上でのモデリングと制御能力の強化を観察する。
論文 参考訳(メタデータ) (2020-04-02T20:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。