論文の概要: Complex Network-Based Approach for Feature Extraction and Classification
of Musical Genres
- arxiv url: http://arxiv.org/abs/2110.04654v1
- Date: Sat, 9 Oct 2021 22:23:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 16:39:37.673917
- Title: Complex Network-Based Approach for Feature Extraction and Classification
of Musical Genres
- Title(参考訳): 複雑なネットワークによる音楽ジャンルの特徴抽出と分類
- Authors: Matheus Henrique Pimenta-Zanon and Glaucia Maria Bressan and
Fabr\'icio Martins Lopes
- Abstract要約: 本研究は,音楽ジャンルの自動分類のための特徴抽出手法を提案する。
提案手法はまずまず音符の列に変換し,その列を複雑なネットワークとしてマッピングする。
音楽ジャンルの分類に適用可能な特徴ベクトルを構成するネットワークトポロジを特徴付けるために、トポロジ測定を抽出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Musical genre's classification has been a relevant research topic. The
association between music and genres is fundamental for the media industry,
which manages musical recommendation systems, and for music streaming services,
which may appear classified by genres. In this context, this work presents a
feature extraction method for the automatic classification of musical genres,
based on complex networks and their topological measurements. The proposed
method initially converts the musics into sequences of musical notes and then
maps the sequences as complex networks. Topological measurements are extracted
to characterize the network topology, which composes a feature vector that
applies to the classification of musical genres. The method was evaluated in
the classification of 10 musical genres by adopting the GTZAN dataset and 8
musical genres by adopting the FMA dataset. The results were compared with
methods in the literature. The proposed method outperformed all compared
methods by presenting high accuracy and low standard deviation, showing its
suitability for the musical genre's classification, which contributes to the
media industry in the automatic classification with assertiveness and
robustness. The proposed method is implemented in an open source in the Python
language and freely available at https://github.com/omatheuspimenta/examinner.
- Abstract(参考訳): 音楽ジャンルの分類は、関連する研究テーマである。
音楽とジャンルの関連は、音楽レコメンデーションシステムを管理するメディア産業と、ジャンルによって分類される可能性のある音楽ストリーミングサービスにとって基本的なものである。
本稿では,複雑なネットワークと位相計測に基づいて,音楽ジャンルの自動分類のための特徴抽出手法を提案する。
提案手法では,まず楽曲を音符列に変換し,その後に複雑なネットワークとしてマッピングする。
位相計測は、音楽ジャンルの分類に適用される特徴ベクトルを構成するネットワークトポロジーを特徴付けるために抽出される。
本手法は,GTZANデータセットと8つの音楽ジャンルをFMAデータセットを用いて,10の楽曲ジャンルの分類において評価した。
結果は文献の手法と比較された。
提案手法は,アサーティブ性とロバスト性を備えた自動分類においてメディア産業に寄与する音楽ジャンルの分類に適合し,高い精度と低い標準偏差を示すことにより,すべての比較手法を上回った。
提案手法はpython言語でオープンソースに実装されており、https://github.com/omatheuspimenta/examinnerで自由に利用できる。
関連論文リスト
- Attention-guided Spectrogram Sequence Modeling with CNNs for Music Genre Classification [0.0]
注意に基づく時間的シグネチャモデリングを用いて音楽ジャンルを分類する革新的なモデルを提案する。
我々のアプローチは各作品の中でもっとも時間的に重要な瞬間を捉え、ジャンル識別のためのユニークな「シグナチャ」を作り上げる。
この研究は、技術的分類タスクと、ジャンルの微妙で人間的な経験のギャップを埋めるものである。
論文 参考訳(メタデータ) (2024-11-18T21:57:03Z) - Music Genre Classification using Large Language Models [50.750620612351284]
本稿では,音楽ジャンル分類のための事前学習された大規模言語モデル(LLM)のゼロショット機能を利用する。
提案手法は、音声信号を20ミリ秒のチャンクに分割し、畳み込み特徴エンコーダで処理する。
推論中、個々のチャンクの予測は最終ジャンル分類のために集約される。
論文 参考訳(メタデータ) (2024-10-10T19:17:56Z) - Music Genre Classification: Training an AI model [0.0]
音楽ジャンル分類は、音声信号の処理に機械学習モデルと技法を利用する分野である。
本研究では,音楽ジャンル分類のための機械学習アルゴリズムについて,音声信号から抽出した特徴を用いて検討する。
ジャンル分類のための機械学習モデルの堅牢性を評価し、その結果を比較することを目的としている。
論文 参考訳(メタデータ) (2024-05-23T23:07:01Z) - Music Genre Classification with ResNet and Bi-GRU Using Visual
Spectrograms [4.354842354272412]
手動のジャンル分類の限界は、より高度なシステムの必要性を強調している。
従来の機械学習技術はジャンル分類の可能性を示してきたが、音楽データの完全な複雑さを捉えられなかった。
本研究では,視覚スペクトログラムを入力として用いる新しいアプローチを提案し,Residual Neural Network(ResNet)とGated Recurrent Unit(GRU)の強みを組み合わせたハイブリッドモデルを提案する。
論文 参考訳(メタデータ) (2023-07-20T11:10:06Z) - MATT: A Multiple-instance Attention Mechanism for Long-tail Music Genre
Classification [1.8275108630751844]
不均衡音楽ジャンル分類は音楽情報検索(MIR)分野において重要な課題である。
既存のモデルのほとんどは、クラスバランスの音楽データセット用に設計されている。
末尾クラスを特定するために,MATT(Multi-Instance Attention)と呼ばれる新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2022-09-09T03:52:44Z) - A Study on Broadcast Networks for Music Genre Classification [0.0]
本稿では,小さなパラメータセットの下での局所化と一般化性の向上を目的とした,放送型ニューラルネットワークについて検討する。
我々のアプローチは、音楽と音声の分類のためのコンパクトで一般化可能なブロードキャストネットワークを実現するための洞察と可能性を提供する。
論文 参考訳(メタデータ) (2022-08-25T13:36:43Z) - Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of
Polyphonic Music [73.73045854068384]
本稿では,新ジャンルネットワークを用いたポリフォニック音楽の歌詞の書き起こしを提案する。
提案するネットワークは,事前学習されたモデルパラメータを採用し,階層間のジャンルアダプタを組み込んで,歌詞とジャンルのペアのジャンルの特色を抽出する。
実験の結果,提案するジャンル条件付きネットワークは既存の歌詞の書き起こしシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-04-07T09:15:46Z) - Sequence Generation using Deep Recurrent Networks and Embeddings: A
study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。
提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文 参考訳(メタデータ) (2020-12-02T14:19:19Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z) - RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement
Learning [69.20460466735852]
本稿では,オンライン伴奏生成のための深層強化学習アルゴリズムを提案する。
提案アルゴリズムは人体に応答し,メロディック,ハーモニック,多種多様な機械部品を生成する。
論文 参考訳(メタデータ) (2020-02-08T03:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。