論文の概要: Comparison of spectrogram scaling in multi-label Music Genre Recognition
- arxiv url: http://arxiv.org/abs/2506.02091v1
- Date: Mon, 02 Jun 2025 15:11:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.356337
- Title: Comparison of spectrogram scaling in multi-label Music Genre Recognition
- Title(参考訳): マルチラベル音楽ジャンル認識におけるスペクトログラムスケーリングの比較
- Authors: Bartosz Karpiński, Cyryl Leszczyński,
- Abstract要約: 本稿では、モデルトレーニングのための複数の前処理手法とアプローチについて述べ、比較する。
実験には、18000以上のエントリを手動でラベル付けしたカスタムデータセットが使用されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As the accessibility and ease-of-use of digital audio workstations increases, so does the quantity of music available to the average listener; additionally, differences between genres are not always well defined and can be abstract, with widely varying combinations of genres across individual records. In this article, multiple preprocessing methods and approaches to model training are described and compared, accounting for the eclectic nature of today's albums. A custom, manually labeled dataset of more than 18000 entries has been used to perform the experiments.
- Abstract(参考訳): デジタルオーディオワークステーションのアクセシビリティと使いやすさが向上するにつれて、平均的なリスナーが利用できる音楽の量も増加する。
本稿では、今日のアルバムのエクレクティックな性質を考慮し、複数の前処理手法とモデルトレーニングアプローチについて述べ、比較する。
実験には、18000以上のエントリを手動でラベル付けしたカスタムデータセットが使用されている。
関連論文リスト
- Modeling Musical Genre Trajectories through Pathlet Learning [3.6133082266958616]
本稿では,辞書学習のパラダイムを用いて,さまざまなジャンルのユーザトラジェクトリをモデル化する。
我々は、パスレットと呼ばれるジャンルトラジェクトリにおける繰り返しパターンをキャプチャする新しいフレームワークを定義する。
その結果,パスレット学習は質的かつ定量的に分析可能な関連する聴取パターンを明らかにした。
論文 参考訳(メタデータ) (2025-05-06T12:33:40Z) - Multi-label Cross-lingual automatic music genre classification from lyrics with Sentence BERT [0.13654846342364302]
本稿では sBERT が生成した多言語文の埋め込みに基づく多言語ジャンル分類システムを提案する。
重なり合う8つのジャンルを持つバイリンガル・ポルトガル語・英語のデータセットを用いて、ある言語で歌詞を訓練し、別の言語でジャンルを予測する能力を示す。
論文 参考訳(メタデータ) (2025-01-07T13:22:35Z) - Impact of time and note duration tokenizations on deep learning symbolic
music modeling [0.0]
共通トークン化手法を解析し、時間と音符の持続時間表現を実験する。
明示的な情報がタスクによってより良い結果をもたらすことを実証する。
論文 参考訳(メタデータ) (2023-10-12T16:56:37Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。
以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文 参考訳(メタデータ) (2023-06-08T15:31:05Z) - MATT: A Multiple-instance Attention Mechanism for Long-tail Music Genre
Classification [1.8275108630751844]
不均衡音楽ジャンル分類は音楽情報検索(MIR)分野において重要な課題である。
既存のモデルのほとんどは、クラスバランスの音楽データセット用に設計されている。
末尾クラスを特定するために,MATT(Multi-Instance Attention)と呼ばれる新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2022-09-09T03:52:44Z) - Towards Context-Aware Neural Performance-Score Synchronisation [2.0305676256390934]
音楽の同期は、音楽の複数の表現を統一的にナビゲートする手段を提供する。
従来の同期手法は知識駆動と性能分析のアプローチを用いてアライメントを計算する。
このPhDは、データ駆動型コンテクスト対応アライメントアプローチの提案により、パフォーマンススコア同期の研究をさらに進める。
論文 参考訳(メタデータ) (2022-05-31T16:45:25Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。