論文の概要: Six Dragons Fly Again: Reviving 15th-Century Korean Court Music with Transformers and Novel Encoding
- arxiv url: http://arxiv.org/abs/2408.01096v1
- Date: Fri, 2 Aug 2024 08:16:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 14:07:18.070911
- Title: Six Dragons Fly Again: Reviving 15th-Century Korean Court Music with Transformers and Novel Encoding
- Title(参考訳): 6つのドラゴンが再び飛ぶ: トランスフォーマーと新しいエンコーディングで15世紀の韓国の宮廷音楽が復活
- Authors: Danbinaerin Han, Mark Gotham, Dongmin Kim, Hannah Park, Sihun Lee, Dasaem Jeong,
- Abstract要約: 我々は15世紀の韓国の宮廷音楽『チワピョン』と『チワピョンヒョン』を復活させるプロジェクトを紹介した。
ジュンガンボの初期の例の1つが、残りのバージョンは初歩的な旋律のみで構成されている。
ベスポーク光音楽認識により取得したJeongganboデータを用いて,BERTのようなマスキング言語モデルとエンコーダ・デコーダ・トランスモデルを訓練した。
結果、チワピョンとチュワイプンヒョンは、ナショナル・グガック・センターのコート・ミュージック・オーケストラによって評価され、演奏された。
- 参考スコア(独自算出の注目度): 2.9206728613540403
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a project that revives a piece of 15th-century Korean court music, Chihwapyeong and Chwipunghyeong, composed upon the poem Songs of the Dragon Flying to Heaven. One of the earliest examples of Jeongganbo, a Korean musical notation system, the remaining version only consists of a rudimentary melody. Our research team, commissioned by the National Gugak (Korean Traditional Music) Center, aimed to transform this old melody into a performable arrangement for a six-part ensemble. Using Jeongganbo data acquired through bespoke optical music recognition, we trained a BERT-like masked language model and an encoder-decoder transformer model. We also propose an encoding scheme that strictly follows the structure of Jeongganbo and denotes note durations as positions. The resulting machine-transformed version of Chihwapyeong and Chwipunghyeong were evaluated by experts and performed by the Court Music Orchestra of National Gugak Center. Our work demonstrates that generative models can successfully be applied to traditional music with limited training data if combined with careful design.
- Abstract(参考訳): 15世紀の朝鮮の宮廷音楽「チワピョン」と「チワピョンヒョン」を復活させるプロジェクトを紹介します。
韓国の音楽表記体系であるJeongganboの初期の例の1つで、残りのバージョンは初歩的なメロディのみで構成されている。
我々の研究チームは、ナショナル・グガック(韓国伝統音楽センター)に委託され、この古いメロディを6パートのアンサンブルのための演奏可能なアレンジに変換することを目指していました。
ベスポーク光音楽認識により取得したJeongganboデータを用いて,BERTのようなマスキング言語モデルとエンコーダ・デコーダ・トランスモデルを訓練した。
また,Jeongganboの構造を厳密に追従し,音符の長さを位置として示す符号化方式を提案する。
結果、ChwapyeongとChwipunghyeongの機械変換版は専門家によって評価され、ナショナル・グガック・センターのコート・ミュージック・オーケストラによって演奏された。
本研究は, 注意深い設計と組み合わせれば, 限られたトレーニングデータを用いて, 生成モデルを従来の音楽に適用できることを実証する。
関連論文リスト
- MMT-BERT: Chord-aware Symbolic Music Generation Based on Multitrack Music Transformer and MusicBERT [44.204383306879095]
シンボリック・マルチトラック音楽生成に特化して設計された新しいシンボリック・ミュージック表現とジェネレーティブ・アディバーショナル・ネットワーク(GAN)フレームワークを提案する。
頑健なマルチトラック・ミュージック・ジェネレータを構築するため,事前学習したMusicBERTモデルを微調整して判別器として機能し,相対論的標準損失を取り入れた。
論文 参考訳(メタデータ) (2024-09-02T03:18:56Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music [21.380568107727207]
中国語で書かれた最初のオープンソース音楽記述ベンチマークであるMuChinを紹介する。
MuChinは、音楽の理解と記述において、マルチモーダルな大規模言語モデルの性能を評価するように設計されている。
ベンチマークに関連するすべてのデータは、スコアコードと詳細な付録とともに、オープンソース化されている。
論文 参考訳(メタデータ) (2024-02-15T10:55:01Z) - Finding Tori: Self-supervised Learning for Analyzing Korean Folk Song [0.966840768820136]
1980-90年代頃の韓国民謡の約700時間におけるフィールド記録データセットの計算解析について紹介する。
ほとんどの曲は伴奏のない非熟練ミュージシャンによって歌われているため、データセットにはいくつかの課題がある。
この課題に対処するために,ピッチ輪郭に基づく畳み込みニューラルネットワークを用いた自己教師型学習を利用した。
論文 参考訳(メタデータ) (2023-08-04T11:13:15Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z) - HUE: Pretrained Model and Dataset for Understanding Hanja Documents of
Ancient Korea [59.35609710776603]
我々は、時系列属性、トピック分類、名前付きエンティティ認識、要約検索タスクからなるハンハ理解評価データセットをリリースする。
また、本研究では、14世紀から19世紀にかけての2つの主要なコーパスについて、ヨセオン王朝のアンナスと王立事務局の日記のトレーニングを継続したBERTベースのモデルについても紹介する。
論文 参考訳(メタデータ) (2022-10-11T03:04:28Z) - Translating Hanja Historical Documents to Contemporary Korean and
English [52.625998002213585]
李氏朝鮮のアナルスには、朝鮮の近代国家に先立つ500年の王国である李氏朝鮮の日記がある。
アナル文字はもともとは古代朝鮮の文体「ハンジャ」で書かれ、1968年から1993年にかけて朝鮮語に翻訳された。
以後、10年間に1人の王の記録が完成した。
本稿では,ハンハの歴史的文書を韓国語や英語に翻訳するニューラルネットワーク翻訳モデルH2KEを提案する。
論文 参考訳(メタデータ) (2022-05-20T08:25:11Z) - MusicBERT: Symbolic Music Understanding with Large-Scale Pre-Training [97.91071692716406]
シンボリック・ミュージックの理解(シンボリック・ミュージックの理解)とは、シンボリック・データから音楽を理解することを指す。
MusicBERTは、音楽理解のための大規模な事前訓練モデルである。
論文 参考訳(メタデータ) (2021-06-10T10:13:05Z) - ChoreoNet: Towards Music to Dance Synthesis with Choreographic Action
Unit [28.877908457607678]
人間の振付処理を模倣する2段階の音楽合成フレームワークChoreoNetを設計する。
本フレームワークはまず,音楽とCAUシーケンス間のマッピング関係を学習するためのCAU予測モデルを考案する。
そこで我々は,CAUシーケンスを連続的なダンス動作に変換するための空間的時間的インペイントモデルを考案した。
論文 参考訳(メタデータ) (2020-09-16T12:38:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。