論文の概要: Finding Tori: Self-supervised Learning for Analyzing Korean Folk Song
- arxiv url: http://arxiv.org/abs/2308.02249v1
- Date: Fri, 4 Aug 2023 11:13:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-07 13:11:48.453258
- Title: Finding Tori: Self-supervised Learning for Analyzing Korean Folk Song
- Title(参考訳): Finding Tori: 韓国民謡の分析のための自己指導型学習
- Authors: Danbinaerin Han, Rafael Caro Repetto, Dasaem Jeong
- Abstract要約: 1980-90年代頃の韓国民謡の約700時間におけるフィールド記録データセットの計算解析について紹介する。
ほとんどの曲は伴奏のない非熟練ミュージシャンによって歌われているため、データセットにはいくつかの課題がある。
この課題に対処するために,ピッチ輪郭に基づく畳み込みニューラルネットワークを用いた自己教師型学習を利用した。
- 参考スコア(独自算出の注目度): 0.966840768820136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce a computational analysis of the field recording
dataset of approximately 700 hours of Korean folk songs, which were recorded
around 1980-90s. Because most of the songs were sung by non-expert musicians
without accompaniment, the dataset provides several challenges. To address this
challenge, we utilized self-supervised learning with convolutional neural
network based on pitch contour, then analyzed how the musical concept of tori,
a classification system defined by a specific scale, ornamental notes, and an
idiomatic melodic contour, is captured by the model. The experimental result
shows that our approach can better capture the characteristics of tori compared
to traditional pitch histograms. Using our approaches, we have examined how
musical discussions proposed in existing academia manifest in the actual field
recordings of Korean folk songs.
- Abstract(参考訳): 本稿では,1980-90年代頃の韓国民謡の約700時間におけるフィールド記録データセットの計算解析について紹介する。
ほとんどの曲は伴奏のない非熟練ミュージシャンによって歌われているため、データセットにはいくつかの課題がある。
この課題に対処するために,ピッチ輪郭に基づく畳み込みニューラルネットワークを用いた自己教師型学習を用いて,特定の音階,装飾音符,慣用旋律輪郭で定義された分類システムであるトーリの音楽的概念をどのように捉えているかを分析した。
実験の結果,従来のピッチヒストグラムと比較して,トーラスの特性をよりよく捉えることができた。
そこで本研究では,韓国民謡のフィールド録音における既存の学界における音楽的議論の展開について検討した。
関連論文リスト
- Automatic Estimation of Singing Voice Musical Dynamics [9.343063100314687]
本稿では,データセットキュレーションの方法論を提案する。
我々は163のスコアファイルと一致して509の楽曲のダイナミックスを歌声の演奏に注釈付けしたデータセットをコンパイルする。
我々は、様々なウィンドウサイズを持つCNNモデルを訓練し、音楽力学を推定するの有効性を評価する。
実験の結果,バークスケールによる音声力学予測は対数メル特徴よりも優れていた。
論文 参考訳(メタデータ) (2024-10-27T18:15:18Z) - Six Dragons Fly Again: Reviving 15th-Century Korean Court Music with Transformers and Novel Encoding [2.9206728613540403]
我々は15世紀の韓国の宮廷音楽『チワピョン』と『チワピョンヒョン』を復活させるプロジェクトを紹介した。
ジュンガンボの初期の例の1つが、残りのバージョンは初歩的な旋律のみで構成されている。
ベスポーク光音楽認識により取得したJeongganboデータを用いて,BERTのようなマスキング言語モデルとエンコーダ・デコーダ・トランスモデルを訓練した。
結果、チワピョンとチュワイプンヒョンは、ナショナル・グガック・センターのコート・ミュージック・オーケストラによって評価され、演奏された。
論文 参考訳(メタデータ) (2024-08-02T08:16:55Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - LyricSIM: A novel Dataset and Benchmark for Similarity Detection in
Spanish Song LyricS [52.77024349608834]
歌詞中の意味的類似性に合わせた新しいデータセットとベンチマークを提案する。
このデータセットはもともと2775組のスペイン語の歌で構成されており、63のネイティブアノテータによる集合アノテーション実験で注釈付けされました。
論文 参考訳(メタデータ) (2023-06-02T07:48:20Z) - MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training [74.32603591331718]
本稿では,MLMスタイルの音響事前学習において,教師モデルと擬似ラベルを組み込んだ大規模自己教師型学習(MERT)を用いた音響音楽理解モデルを提案する。
実験結果から,本モデルでは14曲の楽曲理解タスクを一般化し,性能を向上し,SOTA(State-of-the-art)全体のスコアを達成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-31T18:27:43Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z) - ChMusic: A Traditional Chinese Music Dataset for Evaluation of
Instrument Recognition [4.761003763008295]
本稿では,ChMusicという学習モデルと演奏評価のための中国の伝統音楽データセットを提案する。
このデータセットは無料で公開されており、このデータセットには11の中国伝統楽器と55の中国伝統音楽の抜粋が記録されている。
論文 参考訳(メタデータ) (2021-08-19T03:26:32Z) - Deep Learning Approach for Singer Voice Classification of Vietnamese
Popular Music [1.2043574473965315]
ベトナムのポピュラー音楽の分析に基づいて,歌手の名前を識別する新しい手法を提案する。
音声セグメント検出と歌声分離を前処理ステップとして利用しています。
本手法の正確性を検証するために,ベトナムの有名な歌手18人の歌曲300曲のデータセットを評価した。
論文 参考訳(メタデータ) (2021-02-24T08:03:07Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。