論文の概要: Semi-supervised Neural Chord Estimation Based on a Variational
Autoencoder with Latent Chord Labels and Features
- arxiv url: http://arxiv.org/abs/2005.07091v2
- Date: Tue, 8 Sep 2020 04:31:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 05:38:40.024983
- Title: Semi-supervised Neural Chord Estimation Based on a Variational
Autoencoder with Latent Chord Labels and Features
- Title(参考訳): 潜在コードラベルと特徴を有する変分オートエンコーダに基づく半教師付き神経コード推定
- Authors: Yiming Wu, Tristan Carsault, Eita Nakamura, Kazuyoshi Yoshii
- Abstract要約: 本稿では,自動コード推定のための統計的手法について述べる。
コードアノテーションの入手の有無にかかわらず、音楽信号の有効利用が可能となる。
- 参考スコア(独自算出の注目度): 18.498244371257304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes a statistically-principled semi-supervised method of
automatic chord estimation (ACE) that can make effective use of music signals
regardless of the availability of chord annotations. The typical approach to
ACE is to train a deep classification model (neural chord estimator) in a
supervised manner by using only annotated music signals. In this discriminative
approach, prior knowledge about chord label sequences (model output) has
scarcely been taken into account. In contrast, we propose a unified generative
and discriminative approach in the framework of amortized variational
inference. More specifically, we formulate a deep generative model that
represents the generative process of chroma vectors (observed variables) from
discrete labels and continuous features (latent variables), which are assumed
to follow a Markov model favoring self-transitions and a standard Gaussian
distribution, respectively. Given chroma vectors as observed data, the
posterior distributions of the latent labels and features are computed
approximately by using deep classification and recognition models,
respectively. These three models form a variational autoencoder and can be
trained jointly in a semi-supervised manner. The experimental results show that
the regularization of the classification model based on the Markov prior of
chord labels and the generative model of chroma vectors improved the
performance of ACE even under the supervised condition. The semi-supervised
learning using additional non-annotated data can further improve the
performance.
- Abstract(参考訳): 本稿では,コードアノテーションの有効性に関わらず,音楽信号の有効活用が可能な,統計的に先導した自動コード推定(ACE)手法について述べる。
ACEの典型的なアプローチは、注釈付き音楽信号のみを使用して、教師付き方法で深い分類モデル(神経コード推定器)を訓練することである。
この識別的アプローチでは、コードラベルシーケンス(モデル出力)に関する事前知識はほとんど考慮されていない。
対照的に、償却変分推論の枠組みにおける統一的生成的・識別的アプローチを提案する。
より具体的には、離散ラベルからのクロマベクトル(観測変数)の生成過程を表す深い生成モデルと、それぞれ自己遷移と標準ガウス分布を好むマルコフモデルに従うと仮定される連続的特徴(相対変数)を定式化する。
観測データとしてクロマベクトルが与えられると、潜在ラベルの後方分布と特徴は、それぞれ深い分類と認識モデルを用いて大まかに計算される。
これら3つのモデルは変分オートエンコーダを形成し、半教師付きで共同で訓練することができる。
実験の結果,コードラベルのマルコフ前の分類モデルの正規化とクロマベクトルの生成モデルにより,教師付き条件下においてもACEの性能が向上した。
追加の非注釈データを用いた半教師付き学習により、さらなる性能向上が期待できる。
関連論文リスト
- Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。
本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文 参考訳(メタデータ) (2024-04-26T06:00:27Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - VAESim: A probabilistic approach for self-supervised prototype discovery [0.23624125155742057]
条件付き変分オートエンコーダに基づく画像階層化アーキテクチャを提案する。
我々は、連続した潜伏空間を用いて障害の連続を表現し、訓練中にクラスターを見つけ、画像/患者の成層に使用することができる。
本手法は,標準VAEに対して,分類タスクで測定されたkNN精度において,ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-25T17:55:31Z) - Gaussian Mixture Variational Autoencoder with Contrastive Learning for
Multi-Label Classification [27.043136219527767]
本稿では,新しいコントラスト学習促進型マルチラベル予測モデルを提案する。
教師付き環境でのコントラスト学習を用いることで,ラベル情報を効果的に活用することができる。
学習した埋め込みがラベルとラベルの相互作用の解釈に洞察を与えることを示す。
論文 参考訳(メタデータ) (2021-12-02T04:23:34Z) - Consistency Regularization for Variational Auto-Encoders [14.423556966548544]
変分自動エンコーダ(VAE)は教師なし学習の強力なアプローチである。
本稿では,VAEの整合性を強制する正規化手法を提案する。
論文 参考訳(メタデータ) (2021-05-31T10:26:32Z) - Equivalence of Segmental and Neural Transducer Modeling: A Proof of
Concept [56.46135010588918]
RNN-Transducerモデルとセグメントモデル(直接HMM)の広く使われているクラスが等価であることを証明する。
空白確率はセグメント長確率に変換され,その逆も示された。
論文 参考訳(メタデータ) (2021-04-13T11:20:48Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - Document Ranking with a Pretrained Sequence-to-Sequence Model [56.44269917346376]
関連ラベルを「ターゲット語」として生成するためにシーケンス・ツー・シーケンス・モデルをどのように訓練するかを示す。
提案手法は,データポーラ方式におけるエンコーダのみのモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2020-03-14T22:29:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。