論文の概要: Dynamical Variational Autoencoders: A Comprehensive Review
- arxiv url: http://arxiv.org/abs/2008.12595v4
- Date: Mon, 4 Jul 2022 16:11:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 01:40:29.000034
- Title: Dynamical Variational Autoencoders: A Comprehensive Review
- Title(参考訳): dynamical variational autoencoder: 包括的レビュー
- Authors: Laurent Girin and Simon Leglaive and Xiaoyu Bie and Julien Diard and
Thomas Hueber and Xavier Alameda-Pineda
- Abstract要約: 動的変分オートエンコーダ(DVAE)と呼ばれるモデルの一般的なクラスを紹介し,議論する。
我々は最近提案された7つのDVAEモデルについて詳述し、表記法とプレゼンテーションラインの均質化を目的としている。
我々は,これらの7つのDVAEモデルを再実装し,音声分析・再合成タスクで実施した実験結果を示す。
- 参考スコア(独自算出の注目度): 23.25573952809074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variational autoencoders (VAEs) are powerful deep generative models widely
used to represent high-dimensional complex data through a low-dimensional
latent space learned in an unsupervised manner. In the original VAE model, the
input data vectors are processed independently. Recently, a series of papers
have presented different extensions of the VAE to process sequential data,
which model not only the latent space but also the temporal dependencies within
a sequence of data vectors and corresponding latent vectors, relying on
recurrent neural networks or state-space models. In this paper, we perform a
literature review of these models. We introduce and discuss a general class of
models, called dynamical variational autoencoders (DVAEs), which encompasses a
large subset of these temporal VAE extensions. Then, we present in detail seven
recently proposed DVAE models, with an aim to homogenize the notations and
presentation lines, as well as to relate these models with existing classical
temporal models. We have reimplemented those seven DVAE models and present the
results of an experimental benchmark conducted on the speech
analysis-resynthesis task (the PyTorch code is made publicly available). The
paper concludes with a discussion on important issues concerning the DVAE class
of models and future research guidelines.
- Abstract(参考訳): 変分自己エンコーダ(VAE)は、教師なしの方法で学習された低次元潜在空間を通して高次元複素データを表現するために広く用いられる強力な深部生成モデルである。
元のvaeモデルでは、入力データベクトルは独立に処理される。
最近、一連の論文は、逐次データを処理するためのvaeの異なる拡張を提示している。これは、潜時空間だけでなく、データベクトルと対応する潜時ベクトルのシーケンス内の時間依存性を、再帰的なニューラルネットワークや状態空間モデルに依存してモデル化する。
本稿では,これらのモデルについて文献レビューを行う。
我々は,これらの時間的vae拡張の大きなサブセットを含む動的変分オートエンコーダ(dvaes)と呼ばれる,一般的なモデルのクラスを紹介し,議論する。
そこで,本稿では,提案した7つのDVAEモデルについて詳述する。表記法と提示行を均質化し,これらのモデルを従来の時間モデルと関連付けることを目的としている。
我々は,これらの7つのDVAEモデルを再実装し,音声解析・合成作業(PyTorch符号を公開)で実施した実験結果を示す。
本論文は,DVAEモデルと今後の研究ガイドラインに関する重要な課題について論じる。
関連論文リスト
- PDETime: Rethinking Long-Term Multivariate Time Series Forecasting from
the perspective of partial differential equations [49.80959046861793]
本稿では,ニューラルPDEソルバの原理に着想を得た新しいLMTFモデルであるPDETimeを提案する。
7つの異なる時間的実世界のLMTFデータセットを用いた実験により、PDETimeがデータ固有の性質に効果的に適応できることが判明した。
論文 参考訳(メタデータ) (2024-02-25T17:39:44Z) - Generative Modeling of Regular and Irregular Time Series Data via Koopman VAEs [50.25683648762602]
モデルの新しい設計に基づく新しい生成フレームワークであるKoopman VAEを紹介する。
クープマン理論に触発され、線形写像を用いて潜在条件事前力学を表現する。
KoVAEは、いくつかの挑戦的な合成および実世界の時系列生成ベンチマークにおいて、最先端のGANおよびVAEメソッドより優れている。
論文 参考訳(メタデータ) (2023-10-04T07:14:43Z) - Speech Modeling with a Hierarchical Transformer Dynamical VAE [23.847366888695266]
階層変換器DVAE(HiT-DVAE)を用いた音声信号のモデル化を提案する。
本稿では,HT-DVAEが音声スペクトログラムモデリングにおける他のDVAEよりも優れており,訓練手順が簡単であることを示す。
論文 参考訳(メタデータ) (2023-03-07T13:35:45Z) - A Variational Autoencoder for Heterogeneous Temporal and Longitudinal
Data [0.3749861135832073]
近年,経時的および経時的データを処理可能なVAEの拡張は,医療,行動モデリング,予測保守に応用されている。
本研究では,既存の時間的および縦的VAEをヘテロジニアスデータに拡張するヘテロジニアス縦型VAE(HL-VAE)を提案する。
HL-VAEは高次元データセットに対する効率的な推論を提供し、連続、カウント、カテゴリー、順序データのための可能性モデルを含む。
論文 参考訳(メタデータ) (2022-04-20T10:18:39Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - Unsupervised Multiple-Object Tracking with a Dynamical Variational
Autoencoder [25.293475313066967]
動的変分オートエンコーダ(DVAE)に基づく多目的追跡(MOT)のための教師なし確率モデルと関連する推定アルゴリズムを提案する。
DVAEは潜伏変数の深い生成モデルであり、時間的シーケンスのモデリングのための変分オートエンコーダの拡張と見なすことができる。
DVAE-UMOTには、未ラベルの合成データセットの単一オブジェクト軌道上で事前訓練された後に、オブジェクトのダイナミクスをモデル化するために含まれている。
論文 参考訳(メタデータ) (2022-02-18T17:27:27Z) - Multivariate Data Explanation by Jumping Emerging Patterns Visualization [78.6363825307044]
多変量データセットにおけるパターンの識別と視覚的解釈を支援するVAX(multiVariate dAta eXplanation)を提案する。
既存の類似のアプローチとは異なり、VAXはJumping Emerging Patternsという概念を使って、複数の多様化したパターンを特定し、集約し、データ変数のロジックの組み合わせを通して説明を生成する。
論文 参考訳(メタデータ) (2021-06-21T13:49:44Z) - Discrete Auto-regressive Variational Attention Models for Text Modeling [53.38382932162732]
変分オートエンコーダ(VAE)はテキストモデリングに広く応用されている。
情報不足と後部崩壊という2つの課題に悩まされている。
本稿では,自己回帰変動注意モデル(DAVAM)を提案する。
論文 参考訳(メタデータ) (2021-06-16T06:36:26Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Multivariate Temporal Autoencoder for Predictive Reconstruction of Deep
Sequences [0.0]
時系列の予測とモデリングは、実世界のデータセットにおいて挑戦的な試みであることが証明されている。
2つの重要な問題は、データの多次元性と、遅延出力信号を形成する独立次元の相互作用である。
本稿では,データウィンドウの潜在状態ベクトル表現をモデル化することにより,上記の問題に対処するためのマルチブランチディープニューラルネットワーク手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T21:25:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。