論文の概要: Uncovering audio patterns in music with Nonnegative Tucker Decomposition
for structural segmentation
- arxiv url: http://arxiv.org/abs/2104.08580v1
- Date: Sat, 17 Apr 2021 15:48:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-23 08:59:05.410118
- Title: Uncovering audio patterns in music with Nonnegative Tucker Decomposition
for structural segmentation
- Title(参考訳): 構造分割のための非負タッカー分解による音楽中の音声パターンの発見
- Authors: Axel Marmoret (1), J\'er\'emy E. Cohen (1), Nancy Bertin (1),
Fr\'ed\'eric Bimbot (1) ((1) Univ Rennes, Inria, CNRS, IRISA, France.)
- Abstract要約: 本研究では,ノンネガティブ・タッカー・デコンポジットトン(NTD)の音楽的パターンと構造を音声形式で明らかにする能力を検討する。
NTDがいくつかのパターンの線形結合としてバーの内容を表現する傾向にあるという事実をエクスプロイトし、対応する圧縮空間で繰り返しモチーフを捕捉して取り出す分解能力を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent work has proposed the use of tensor decomposition to model repetitions
and to separate tracks in loop-based electronic music. The present work
investigates further on the ability of Nonnegative Tucker Decompositon (NTD) to
uncover musical patterns and structure in pop songs in their audio form.
Exploiting the fact that NTD tends to express the content of bars as linear
combinations of a few patterns, we illustrate the ability of the decomposition
to capture and single out repeated motifs in the corresponding compressed
space, which can be interpreted from a musical viewpoint. The resulting
features also turn out to be efficient for structural segmentation, leading to
experimental results on the RWC Pop data set which are potentially challenging
state-of-the-art approaches that rely on extensive example-based learning
schemes.
- Abstract(参考訳): 近年の研究では、テンソル分解を用いて繰り返しをモデル化し、ループベースの電子音楽でトラックを分離することを提案している。
本研究は,Non negative Tucker Decompositon (NTD) によるポップソングの楽曲パターンと構造を明らかにする能力について検討する。
ntdがいくつかのパターンの線形結合としてバーの内容を表現しがちであるという事実を生かして、音楽的な観点から解釈可能な、対応する圧縮空間で繰り返しモチーフをキャプチャし、シングルアウトする分解の能力を示す。
結果として得られた機能は、構造的なセグメンテーションに効率的であることが判明し、広範なサンプルベースの学習スキームに依存する最先端のアプローチに潜在的に挑戦する可能性のあるrwc popデータセットの実験結果につながった。
関連論文リスト
- LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation [49.89372182441713]
マルチモーダルコールドスタートプレイリスト継続モデルであるLARPを導入する。
我々のフレームワークはタスク固有の抽象化の段階を増大させており、イントラトラック(音声)コントラスト損失、トラックトラックコントラスト損失、トラックプレイリストコントラスト損失である。
論文 参考訳(メタデータ) (2024-06-20T14:02:15Z) - Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music
Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。
テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。
実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文 参考訳(メタデータ) (2022-11-21T07:19:17Z) - Barwise Compression Schemes for Audio-Based Music Structure Analysis [4.39160562548524]
音楽構造解析 (MSA) は、楽曲を複数の異なるセクションに分割する。
我々は、曲のオリジナル内容の簡易な表現により、構造がより容易に明らかにされるという仮説の下で、圧縮フレームワーク内のMSAにアプローチする。
本実験では,非教師なし圧縮方式により,最先端の教師付き手法に匹敵する性能を実現する。
論文 参考訳(メタデータ) (2022-02-10T12:23:57Z) - Exploring single-song autoencoding schemes for audio-based music
structure analysis [6.037383467521294]
この研究は、低次元のオートエンコーダを訓練し、特定の歌に特有の潜在/圧縮表現を学習する「ピース固有」オートエンコード方式を探求する。
提案手法は,3秒耐性を有する教師付き最先端手法の性能レベルを実現する。
論文 参考訳(メタデータ) (2021-10-27T13:48:25Z) - ModeRNN: Harnessing Spatiotemporal Mode Collapse in Unsupervised
Predictive Learning [75.2748374360642]
そこで本研究では,繰り返し状態間の隠れ構造表現を学習するための新しい手法であるModeRNNを提案する。
データセット全体にわたって、異なるモードがスロットの混合に対して異なるレスポンスをもたらすため、ModeRNNが構造化された表現を構築する能力が向上する。
論文 参考訳(メタデータ) (2021-10-08T03:47:54Z) - Structure-Aware Audio-to-Score Alignment using Progressively Dilated
Convolutional Neural Networks [8.669338893753885]
音楽演奏と楽譜の間の構造的差異の同定は、音声とスコアのアライメントにおいて難しいが不可欠なステップである。
本稿では、進化的に拡張された畳み込みニューラルネットワークを用いて、そのような違いを検出する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-31T05:14:58Z) - Lets Play Music: Audio-driven Performance Video Generation [58.77609661515749]
オーディオ駆動型パーパフォーマンスビデオ生成(APVG)という新しいタスクを提案する。
APVGは、特定の音楽オーディオクリップでガイドされた特定の楽器を演奏する人のビデオを合成することを目的としている。
論文 参考訳(メタデータ) (2020-11-05T03:13:46Z) - On Long-Tailed Phenomena in Neural Machine Translation [50.65273145888896]
最先端のニューラルネットワーク翻訳(NMT)モデルは、低周波トークンの生成に苦労する。
条件付きテキスト生成における構造的依存関係にモデルトレーニングを適応させるために,新たな損失関数である反焦点損失を提案する。
提案手法は,複数の機械翻訳(MT)データセットに対して有効であり,クロスエントロピーよりも顕著に向上することを示す。
論文 参考訳(メタデータ) (2020-10-10T07:00:57Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z) - Music Generation with Temporal Structure Augmentation [0.0]
提案手法は,歌の結末をカウントダウンしたコネクショニスト生成モデルと,余分な入力特徴としてメーターマーカーを付加する。
LSTMセルを持つRNNアーキテクチャは、教師付きシーケンス学習設定でノッティンガムフォークミュージックデータセットに基づいて訓練される。
実験では、両方のアノテーションの予測性能が改善された。
論文 参考訳(メタデータ) (2020-04-21T19:19:58Z) - Modeling Musical Structure with Artificial Neural Networks [0.0]
音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。
Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。
本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
論文 参考訳(メタデータ) (2020-01-06T18:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。