論文の概要: Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music
- arxiv url: http://arxiv.org/abs/2505.11378v1
- Date: Fri, 16 May 2025 15:41:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:15.476298
- Title: Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music
- Title(参考訳): 現代男性ポップミュージックにおける音声登録分類への機械学習アプローチ
- Authors: Alexander Kim, Charlotte Botha,
- Abstract要約: ポップミュージックでは、1人のアーティストが好みの質を達成するために様々な音色やテクスチャを使用する場合があり、歌手が使用するボーカル範囲内でのボーカルレジスタを特定することは困難である。
本稿では,メル・スペクトログラム画像のテクスチャ的特徴の分析を通じて,男性ポップミュージックの音声信号に声帯を分類する2つの方法を提案する。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For singers of all experience levels, one of the most daunting challenges in learning technical repertoire is navigating placement and vocal register in and around the passagio (passage between chest voice and head voice registers). Particularly in pop music, where a single artist may use a variety of timbre's and textures to achieve a desired quality, it can be difficult to identify what vocal register within the vocal range a singer is using. This paper presents two methods for classifying vocal registers in an audio signal of male pop music through the analysis of textural features of mel-spectrogram images. Additionally, we will discuss the practical integration of these models for vocal analysis tools, and introduce a concurrently developed software called AVRA which stands for Automatic Vocal Register Analysis. Our proposed methods achieved consistent classification of vocal register through both Support Vector Machine (SVM) and Convolutional Neural Network (CNN) models, which supports the promise of more robust classification possibilities across more voice types and genres of singing.
- Abstract(参考訳): あらゆる経験のある歌手にとって、技術的レパートリーを学ぶ上で最も大変な課題の1つは、パスタギオ(胸声と頭声のパスタジ)の周囲に位置と声域を移動させることである。
特にポップミュージックでは、一人のアーティストが様々な音色やテクスチャを使って所望の品質を達成できるため、歌手が使用するボーカル範囲内でのボーカルレジスタを特定することは困難である。
本稿では,メル・スペクトログラム画像のテクスチャ的特徴の分析を通じて,男性ポップミュージックの音声信号に声帯を分類する2つの方法を提案する。
さらに,これらのモデルの音声解析ツールへの実践的な統合について論じるとともに,自動声道レジスタ解析(Automatic Vocal Register Analysis)の略であるAVRA(AVRA)というソフトウェアを同時開発する。
提案手法は,SVM(Support Vector Machine)モデルと畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)モデルの両方を用いて,声帯の一貫性のある分類を実現した。
関連論文リスト
- Singer Identity Representation Learning using Self-Supervised Techniques [0.0]
歌唱関連タスクに適した表現を抽出するシンガーアイデンティティエンコーダを訓練するためのフレームワークを提案する。
我々は,孤立した音声トラックの集合体上で,異なる自己教師付き学習手法を探索する。
歌手の類似度と識別タスクにおける表現の質を評価する。
論文 参考訳(メタデータ) (2024-01-10T10:41:38Z) - StyleSinger: Style Transfer for Out-of-Domain Singing Voice Synthesis [63.18764165357298]
ドメイン外歌唱音声合成(SVS)のためのスタイル転送は、目に見えないスタイルで高品質な歌唱音声を生成することに焦点を当てている。
StyleSingerは、ドメイン外参照音声サンプルのゼロショットスタイル転送のための最初の歌声合成モデルである。
ゼロショット・スタイル・トランスファーにおける評価は、StyleSingerが基準歌唱音声サンプルの音質と類似性の両方でベースライン・モデルより優れていることを不確実に証明している。
論文 参考訳(メタデータ) (2023-12-17T15:26:16Z) - PrimaDNN': A Characteristics-aware DNN Customization for Singing
Technique Detection [5.399268560100004]
そこで本稿では,特徴指向の改良を目的としたディープニューラルネットワークモデルであるPimaDNNを提案する。
J-POPの歌唱技術検出の結果、PrimaDNNはマクロFで44.9%の最高の結果を得た。
論文 参考訳(メタデータ) (2023-06-25T10:15:18Z) - Learning the Beauty in Songs: Neural Singing Voice Beautifier [69.21263011242907]
我々は、新しいタスク、歌声美化(SVB)に興味を持っている。
アマチュア歌手の歌声を考えると、SVBは内容と声の音色を保ちながら、声のイントネーションと声のトーンを改善することを目的としている。
SVBタスクを解く最初の生成モデルであるNSVB(Neural Singing Voice Beautifier)を導入する。
論文 参考訳(メタデータ) (2022-02-27T03:10:12Z) - Audiovisual Singing Voice Separation [25.862550744570324]
ビデオモデルは口の動きを入力し、それをオーディオベースの分離フレームワークの機能埋め込みに融合する。
トレーニングと評価のための2つのオーディオヴィジュアルな歌唱パフォーマンスデータセットを作成します。
提案手法は、ほとんどのテスト記録における分離品質の観点から、音声ベースの手法よりも優れる。
論文 参考訳(メタデータ) (2021-07-01T06:04:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。