論文の概要: A Computational Analysis of Pitch Drift in Unaccompanied Solo Singing
using DBSCAN Clustering
- arxiv url: http://arxiv.org/abs/2204.01009v1
- Date: Sun, 3 Apr 2022 06:54:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 09:05:57.604952
- Title: A Computational Analysis of Pitch Drift in Unaccompanied Solo Singing
using DBSCAN Clustering
- Title(参考訳): DBSCANクラスタリングによる無伴奏ソロ歌唱におけるピッチドリフトの計算解析
- Authors: Sepideh Shafiei and S. Hakam
- Abstract要約: 伴奏のないボーカリストは、通常、意図せずにチューニングを変更し、長い演奏の開始点よりも高いまたは低いピッチで終わる。
この現象はピッチドリフトと呼ばれ、演奏者の技量や演奏の長さや難易度など、様々な要素に依存する。
本稿では, ピッチヒストグラムとDBSCANクラスタリングを用いて, 伴奏のない声道演奏におけるピッチドリフトの測定方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unaccompanied vocalists usually change the tuning unintentionally and end up
with a higher or lower pitch than the starting point during a long performance.
This phenomenon is called pitch drift, which is dependent on various elements,
such as the skill of the performer, and the length and difficulty of the
performance. In this paper, we propose a computational method for measuring
pitch drift in the course of an unaccompanied vocal performance, using pitch
histogram and DBSCAN clustering.
- Abstract(参考訳): 伴奏のないボーカリストは通常、意図せず調律を変更し、長い演奏中に開始点よりも高いピッチまたは低いピッチで終わる。
この現象はピッチドリフトと呼ばれ、演奏者の技量や演奏の長さや難易度など、様々な要素に依存する。
本稿では、ピッチヒストグラムとDBSCANクラスタリングを用いて、伴奏のない声道演奏におけるピッチドリフトを測定するための計算手法を提案する。
関連論文リスト
- Enhancing the vocal range of single-speaker singing voice synthesis with
melody-unsupervised pre-training [82.94349771571642]
本研究では, メロディ非教師型マルチスピーカ事前学習法を提案し, シングルスピーカの発声域を拡大する。
合成音声のリズム自然性を改善するために、識別可能な持続時間調整器を導入するのは、これが初めてである。
実験により,提案したSVSシステムは,音質と自然性の両方において,ベースラインよりも優れていることを確認した。
論文 参考訳(メタデータ) (2023-09-01T06:40:41Z) - RMSSinger: Realistic-Music-Score based Singing Voice Synthesis [56.51475521778443]
RMS-SVSは、異なる音符タイプでリアル音楽のスコアを与えられた高品質な歌声を生成することを目的としている。
RMS-SVS方式であるRMSSingerを提案する。
RMSSingerでは,時間を要する音素の持続時間アノテーションと複雑な音素レベルのメルノートアライメントを避けるために,単語レベルのモデリングを導入する。
論文 参考訳(メタデータ) (2023-05-18T03:57:51Z) - AlignSTS: Speech-to-Singing Conversion via Cross-Modal Alignment [67.10208647482109]
STS音声変換タスクは,音声録音に対応する歌唱サンプルを生成することを目的としている。
本稿では,明示的なクロスモーダルアライメントに基づくSTSモデルであるAlignSTSを提案する。
実験の結果、AlignSTSは客観的メトリクスと主観的メトリクスの両方で優れたパフォーマンスを達成している。
論文 参考訳(メタデータ) (2023-05-08T06:02:10Z) - A Comparative Analysis Of Latent Regressor Losses For Singing Voice
Conversion [15.691936529849539]
シンガーレコードのメル-スペクトログラム上のシンガーアイデンティティ埋め込み(SIE)ネットワークは、シンガー固有の分散符号化を生成する。
本稿では,これらの評価がピッチレジスタの違いの影響を受けないように,ソースとターゲットの歌手間のピッチマッチング機構を提案する。
論文 参考訳(メタデータ) (2023-02-27T11:26:57Z) - On Compressing Sequences for Self-Supervised Speech Models [78.62210521316081]
自己教師型学習における時間軸に沿った固定長と可変長のサブサンプリングについて検討した。
可変長サブサンプリングは,低フレームレートで特に良好に動作することがわかった。
音素境界にアクセスできる場合、平均フレームレートが10Hz以下の場合、性能の劣化は見つからない。
論文 参考訳(メタデータ) (2022-10-13T17:10:02Z) - Improved singing voice separation with chromagram-based pitch-aware
remixing [26.299721372221736]
高いピッチアライメントを持つ音楽セグメントを混合したクロマグラムベースのピッチ認識リミックスを提案する。
我々は、ピッチ認識リミックスによるトレーニングモデルにより、テスト信号-歪み比(SDR)が大幅に改善されることを実証した。
論文 参考訳(メタデータ) (2022-03-28T20:55:54Z) - Learning the Beauty in Songs: Neural Singing Voice Beautifier [69.21263011242907]
我々は、新しいタスク、歌声美化(SVB)に興味を持っている。
アマチュア歌手の歌声を考えると、SVBは内容と声の音色を保ちながら、声のイントネーションと声のトーンを改善することを目的としている。
SVBタスクを解く最初の生成モデルであるNSVB(Neural Singing Voice Beautifier)を導入する。
論文 参考訳(メタデータ) (2022-02-27T03:10:12Z) - DiffSinger: Diffusion Acoustic Model for Singing Voice Synthesis [53.19363127760314]
DiffSingerは、音楽スコアで調整されたメログラムにノイズを反復的に変換するパラメータ化されたマルコフチェーンです。
中国の歌唱データセットで行った評価は、DiffSingerが最先端のSVSワークを顕著な差で上回っていることを示している。
論文 参考訳(メタデータ) (2021-05-06T05:21:42Z) - Structure and Automatic Segmentation of Dhrupad Vocal Bandish Audio [9.239082696657876]
この研究は、バンディッシュ(作曲)演奏の時間とともに変化する音楽的に関係するリズム密度を自動的に検出することに関するものである。
局所的なテンポや関係を検知し,時間的スムースに追従するように訓練されたCNNベースのシステムについて検討する。
これにより、2人の演奏者のリズミカル相互作用の変化を捉えることで、演奏セクションの完全な音楽的記述を得るのに役立ちます。
論文 参考訳(メタデータ) (2020-08-03T10:16:42Z) - Deep Autotuner: a Pitch Correcting Network for Singing Performances [26.019582802302033]
独唱演奏の自動ピッチ補正のためのデータ駆動方式を提案する。
良いイントネーションのために選択された4,702人のアマチュアカラオケパフォーマンスのデータセットを用いてニューラルネットワークモデルをトレーニングする。
畳み込み層上にゲートリカレントユニットを配置したディープニューラルネットワークは,実世界の楽譜なしの歌唱ピッチ補正タスクにおいて,有望な性能を示す。
論文 参考訳(メタデータ) (2020-02-12T01:33:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。