論文の概要: Music Genre Classification Using Machine Learning Techniques
- arxiv url: http://arxiv.org/abs/2509.01762v1
- Date: Mon, 01 Sep 2025 20:43:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.837114
- Title: Music Genre Classification Using Machine Learning Techniques
- Title(参考訳): 機械学習技術を用いた音楽ジャンルの分類
- Authors: Alokit Mishra, Ryyan Akhtar,
- Abstract要約: 本稿では,自動ジャンル分類のための機械学習手法の比較分析を行う。
本研究では,SVM(Support Vector Machines)やアンサンブル手法を含む古典的分類器の性能を評価する。
ドメイン固有の特徴工学を活用するSVMは、エンドツーエンドのCNNモデルよりも優れた分類精度を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a comparative analysis of machine learning methodologies for automatic music genre classification. We evaluate the performance of classical classifiers, including Support Vector Machines (SVM) and ensemble methods, trained on a comprehensive set of hand-crafted audio features, against a Convolutional Neural Network (CNN) operating on Mel spectrograms. The study is conducted on the widely-used GTZAN dataset. Our findings demonstrate a noteworthy result: the SVM, leveraging domain-specific feature engineering, achieves superior classification accuracy compared to the end-to-end CNN model. We attribute this outcome to the data-constrained nature of the benchmark dataset, where the strong inductive bias of engineered features provides a regularization effect that mitigates the risk of overfitting inherent in high-capacity deep learning models. This work underscores the enduring relevance of traditional feature extraction in practical audio processing tasks and provides a critical perspective on the universal applicability of deep learning, especially for moderately sized datasets.
- Abstract(参考訳): 本稿では,自動ジャンル分類のための機械学習手法の比較分析を行う。
我々は,Melスペクトログラムを用いた畳み込みニューラルネットワーク(CNN)に対して,手作り音声の包括的セットに基づいて訓練されたSVM(Support Vector Machines)やアンサンブル手法を含む古典的分類器の性能を評価する。
この研究は広く使われているGTZANデータセットを用いて行われた。
ドメイン固有の特徴工学を活用するSVMは、エンドツーエンドのCNNモデルよりも優れた分類精度を実現する。
この結果は,高容量深層学習モデルに固有の過度適合のリスクを緩和する正規化効果を,エンジニアリング機能の強い帰納バイアスがもたらす,ベンチマークデータセットの制約された性質に起因している。
この研究は、実用的な音声処理タスクにおける伝統的な特徴抽出の持続的関連性を強調し、特に中程度のデータセットにおいて、ディープラーニングの普遍的な適用性について批判的な視点を提供する。
関連論文リスト
- VSFormer: Value and Shape-Aware Transformer with Prior-Enhanced Self-Attention for Multivariate Time Series Classification [47.92529531621406]
識別パターン(形状)と数値情報(値)の両方を組み込んだVSFormerを提案する。
さらに、教師付き情報から派生したクラス固有の事前情報を抽出し、位置エンコーディングを強化する。
30のUEAアーカイブデータセットに対する大規模な実験は、SOTAモデルと比較して、我々の手法の優れた性能を示す。
論文 参考訳(メタデータ) (2024-12-21T07:31:22Z) - Leveraging Semi-Supervised Learning to Enhance Data Mining for Image Classification under Limited Labeled Data [35.431340001608476]
従来のデータマイニング手法は、大規模で高次元で複雑なデータに直面すると不十分である。
本研究では,ラベルのないデータを利用するアルゴリズムの能力向上を目的とした,半教師付き学習手法を提案する。
具体的には、自己学習法を採用し、画像の特徴抽出と分類のための畳み込みニューラルネットワーク(CNN)と組み合わせる。
論文 参考訳(メタデータ) (2024-11-27T18:59:50Z) - Principal Orthogonal Latent Components Analysis (POLCA Net) [0.27309692684728604]
表現学習は、分類、予測、クラスタリングといったタスクにより有用で関連性の高い機能を学ぶことを目的としている。
我々はPCAとLDA機能を非線形領域に模倣し拡張するためのPOLCANet(Principal Orthogonal Latent Components Analysis Network)を導入する。
論文 参考訳(メタデータ) (2024-10-09T14:04:31Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Understanding learning from EEG data: Combining machine learning and
feature engineering based on hidden Markov models and mixed models [0.0]
前頭蓋振動は空間ナビゲーションや記憶において重要な役割を担っていると考えられている。
EEGデータセットは非常に複雑で、神経信号の変化を解釈しにくくする。
本稿では,脳波データから特徴を抽出するために隠れマルコフと線形混合効果モデルを提案する。
論文 参考訳(メタデータ) (2023-11-14T12:24:12Z) - An Unsupervised Machine Learning Approach for Ground-Motion Spectra
Clustering and Selection [6.3376363722490145]
本稿では,地震動スペクトルの特徴を抽出する教師なし機械学習アルゴリズムを提案する。
潜時特性は、ニューラルネットワークオートエンコーダの非線形関係を通して学習された低次元の機械によるスペクトル特性である。
合成およびフィールド記録された地動データセットの使用など、このアプローチを検証するための3つの例が提示される。
論文 参考訳(メタデータ) (2022-12-06T18:02:55Z) - Machine Learning For Classification Of Antithetical Emotional States [1.1602089225841632]
本研究は,DEAPデータセット上でのベースライン機械学習分類器の性能を解析する。
ディープラーニングアーキテクチャによるパフォーマンス向上を活用して、最先端に匹敵する結果を提供する。
論文 参考訳(メタデータ) (2022-09-06T06:54:33Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。