論文の概要: Towards Cover Song Detection with Siamese Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2005.10294v1
- Date: Wed, 20 May 2020 18:14:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 05:13:13.340085
- Title: Towards Cover Song Detection with Siamese Convolutional Neural Networks
- Title(参考訳): シームズ畳み込みニューラルネットワークによるカバーソング検出に向けて
- Authors: Marko Stamenovic
- Abstract要約: 私たちは、数万のカバーソングオーディオクリップでニューラルネットワークをトレーニングし、保留のセットでそれをテストします。
最小バッチの65%の平均精度@1をランダムな推測の10倍の精度で取得する。
- 参考スコア(独自算出の注目度): 0.4737991126491218
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A cover song, by definition, is a new performance or recording of a
previously recorded, commercially released song. It may be by the original
artist themselves or a different artist altogether and can vary from the
original in unpredictable ways including key, arrangement, instrumentation,
timbre and more. In this work we propose a novel approach to learning audio
representations for the task of cover song detection. We train a neural
architecture on tens of thousands of cover-song audio clips and test it on a
held out set. We obtain a mean precision@1 of 65% over mini-batches, ten times
better than random guessing. Our results indicate that Siamese network
configurations show promise for approaching the cover song identification
problem.
- Abstract(参考訳): カバー・ソング(英: cover song)とは、以前に録音された商業的にリリースされた楽曲の新たな演奏または録音である。
オリジナルアーティスト自身か別のアーティストによるもので、キー、アレンジメント、楽器、音色など、予測不可能な方法でオリジナルから変化することができる。
そこで本研究では,楽曲検出作業における音声表現の学習方法を提案する。
私たちは、数万のカバーソングオーディオクリップでニューラルネットワークをトレーニングし、保留セットでそれをテストします。
最小バッチの65%の平均精度@1をランダムな推測の10倍の精度で取得する。
以上の結果から,シャムのネットワーク構成はカバーソング識別問題に接近する可能性が示唆された。
関連論文リスト
- SongCreator: Lyrics-based Universal Song Generation [53.248473603201916]
SongCreatorは、声楽と伴奏の両方で曲を生成するという課題に取り組むために設計された曲生成システムである。
モデルには2つの新しいデザインがある: ボーカルの情報と伴奏を収録するための巧妙に設計された二重系列言語モデル (M) と、DSLMのための一連の注意マスク戦略である。
実験では,8つのタスクすべてに対して,最先端ないし競争的なパフォーマンスを実現することにより,SongCreatorの有効性を示す。
論文 参考訳(メタデータ) (2024-09-09T19:37:07Z) - REFFLY: Melody-Constrained Lyrics Editing Model [50.03960548399128]
任意の形態のプレーンテキストドラフトを高品質で本格的な歌詞に編集するための,最初の改訂フレームワークであるREFFLYを紹介する。
提案手法は,生成した歌詞が原文の意味を保ち,旋律と整合し,所望の曲構造に固執することを保証する。
論文 参考訳(メタデータ) (2024-08-30T23:22:34Z) - Innovations in Cover Song Detection: A Lyrics-Based Approach [1.192676421261413]
歌の歌詞を利用したカバー歌検出手法を提案する。
曲とその対応するオリジナルをカバーする新しいデータセットを提案する。
他のカバーソングのデータセットとは対照的に、オリジナルソングとカバーソングの注釈付き歌詞を含んでいる。
論文 参考訳(メタデータ) (2024-06-06T06:52:25Z) - A Proactive and Dual Prevention Mechanism against Illegal Song Covers
empowered by Singing Voice Conversion [19.92036453116877]
SongBsAbは、認可されていないSVCベースの違法な曲のカバーを緩和するための最初の積極的なアプローチである。
SongBsAbは、人間の知覚できない摂動を歌声に導入し、それを解放する。
3つのSVCモデルと2つのデータセットに対して,SongBsAbの防止効果,有効性,堅牢性を示す。
論文 参考訳(メタデータ) (2024-01-30T16:07:44Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z) - An Analysis of Classification Approaches for Hit Song Prediction using
Engineered Metadata Features with Lyrics and Audio Features [5.871032585001082]
本研究は,より代替的なメタデータを用いて,Billboard Hot 100曲のトップ10ヒット曲の予測結果を改善することを目的としている。
k-nearest、Naive Bayes、Random Forest、Logistic Regression、Multilayer Perceptronの5つの機械学習アプローチが適用される。
その結果,Random Forest (RF) と Logistic Regression (LR) は,それぞれ89.1%,87.2%,0.91,0.93AUCを達成している。
論文 参考訳(メタデータ) (2023-01-31T09:48:53Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - Audio-guided Album Cover Art Generation with Genetic Algorithms [4.189054768366433]
音声特徴によってガイドされたカバーアートを生成するための新しいディープラーニングフレームワークを提案する。
VQGAN-CLIPにインスパイアされた当社のアプローチは,再トレーニングを必要とせずに個々のコンポーネントを簡単に置き換えることができるため,非常に柔軟である。
我々のフレームワークは、ほとんどのジャンルで適切なカバーアートを生成でき、視覚的特徴がオーディオ機能の変化に適応していることがわかりました。
論文 参考訳(メタデータ) (2022-07-14T18:41:00Z) - Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of
Polyphonic Music [73.73045854068384]
本稿では,新ジャンルネットワークを用いたポリフォニック音楽の歌詞の書き起こしを提案する。
提案するネットワークは,事前学習されたモデルパラメータを採用し,階層間のジャンルアダプタを組み込んで,歌詞とジャンルのペアのジャンルの特色を抽出する。
実験の結果,提案するジャンル条件付きネットワークは既存の歌詞の書き起こしシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-04-07T09:15:46Z) - Learning the Beauty in Songs: Neural Singing Voice Beautifier [69.21263011242907]
我々は、新しいタスク、歌声美化(SVB)に興味を持っている。
アマチュア歌手の歌声を考えると、SVBは内容と声の音色を保ちながら、声のイントネーションと声のトーンを改善することを目的としている。
SVBタスクを解く最初の生成モデルであるNSVB(Neural Singing Voice Beautifier)を導入する。
論文 参考訳(メタデータ) (2022-02-27T03:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。