論文の概要: SongSong: A Time Phonograph for Chinese SongCi Music from Thousand of Years Away
- arxiv url: http://arxiv.org/abs/2602.24071v1
- Date: Fri, 27 Feb 2026 15:02:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.476311
- Title: SongSong: A Time Phonograph for Chinese SongCi Music from Thousand of Years Away
- Title(参考訳): SongSong:数千年前の中国のSongCiミュージックのタイムフォノグラフ
- Authors: Jiajia Li, Jiliang Hu, Ziyi Pan, Chong Chen, Zuchao Li, Ping Wang, Lefei Zhang,
- Abstract要約: 我々は,中国語のSongCiを復元できる最初の音楽生成モデルであるSongSongを紹介した。
我々のモデルはまず入力されたSongCiからメロディを予測し、そのメロディに基づいて歌声と伴奏を別々に生成し、最後にすべての要素を組み合わせて最後の楽曲を生成する。
SongCiの実行におけるSongSongの習熟度を評価するために,評価用トレーニングセットに含まれない85のSongCi文をランダムに選択した。
- 参考スコア(独自算出の注目度): 58.01505919040677
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, there have been significant advancements in music generation. However, existing models primarily focus on creating modern pop songs, making it challenging to produce ancient music with distinct rhythms and styles, such as ancient Chinese SongCi. In this paper, we introduce SongSong, the first music generation model capable of restoring Chinese SongCi to our knowledge. Our model first predicts the melody from the input SongCi, then separately generates the singing voice and accompaniment based on that melody, and finally combines all elements to create the final piece of music. Additionally, to address the lack of ancient music datasets, we create OpenSongSong, a comprehensive dataset of ancient Chinese SongCi music, featuring 29.9 hours of compositions by various renowned SongCi music masters. To assess SongSong's proficiency in performing SongCi, we randomly select 85 SongCi sentences that were not part of the training set for evaluation against SongSong and music generation platforms such as Suno and SkyMusic. The subjective and objective outcomes indicate that our proposed model achieves leading performance in generating high-quality SongCi music.
- Abstract(参考訳): 近年、音楽の発達が著しい。
しかし、既存のモデルは、主に近代的なポップソングの作成に焦点をあてており、古代中国のソンチーのようなリズムやスタイルの異なる古代音楽の制作を困難にしている。
本稿では,中国語のSongCiを復元できる最初の音楽生成モデルであるSongSongを紹介する。
我々のモデルはまず入力されたSongCiからメロディを予測し、そのメロディに基づいて歌声と伴奏を別々に生成し、最後にすべての要素を組み合わせて最後の楽曲を生成する。
また、古代音楽データセットの欠如に対処するため、古代中国音楽の包括的データセットであるOpenSongSongを作成した。
SongSongのSongCi演奏能力を評価するために,SongSongとSunoやSkyMusicなどの音楽生成プラットフォームに対する評価のトレーニングセットに含まれていない85のSongCi文をランダムに選択した。
主観的および客観的な結果から,提案モデルが高品質なSongCi音楽の創出において,先行的な性能を達成することが示唆された。
関連論文リスト
- The Renaissance of Expert Systems: Optical Recognition of Printed Chinese Jianpu Musical Scores with Lyrics [8.267152843754557]
本稿では,印刷されたJianpuのスコアと歌詞を機械可読なMusicXMLとMIDIに変換するモジュール型エキスパートシステムパイプラインを提案する。
このシステムは、メロディ(ノートワイズF1 = 0.951)とアライメント歌詞の両方で高精度な認識を実現する。
論文 参考訳(メタデータ) (2025-12-15T15:04:57Z) - YuE: Scaling Open Foundation Models for Long-Form Music Generation [172.52183330644303]
YuEはLLaMA2アーキテクチャに基づいたオープンファンデーションモデルのファミリーである。
歌詞のアライメント、コヒーレントな音楽構造、適切な伴奏を伴う声楽メロディを維持しながら、最大5分間の音楽を生成する。
論文 参考訳(メタデータ) (2025-03-11T17:26:50Z) - Music for All: Representational Bias and Cross-Cultural Adaptability of Music Generation Models [13.568559786822457]
本稿では,音楽生成のためのデータセットと研究論文について述べる。
既存の音楽データセットの合計時間のうち、西洋以外のジャンルから得られる時間はわずか5.7%である。
論文 参考訳(メタデータ) (2025-02-11T07:46:29Z) - SongCreator: Lyrics-based Universal Song Generation [53.248473603201916]
SongCreatorは、声楽と伴奏の両方で曲を生成するという課題に取り組むために設計された曲生成システムである。
モデルには2つの新しいデザインがある: ボーカルの情報と伴奏を収録するための巧妙に設計された二重系列言語モデル (M) と、DSLMのための一連の注意マスク戦略である。
実験では,8つのタスクすべてに対して,最先端ないし競争的なパフォーマンスを実現することにより,SongCreatorの有効性を示す。
論文 参考訳(メタデータ) (2024-09-09T19:37:07Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - SongComposer: A Large Language Model for Lyric and Melody Generation in Song Composition [82.38021790213752]
SongComposerは、音楽専門の大規模言語モデル(LLM)である。
3つの重要なイノベーションを活用することで、メロディーをLLMに同時に構成する能力を統合する。
歌詞からメロディへの生成、メロディから歌詞への生成、歌の継続、テキストから歌への生成といったタスクにおいて、高度なLLMよりも優れています。
SongComposeは大規模なトレーニング用データセットで、中国語と英語の歌詞とメロディのペアを含む。
論文 参考訳(メタデータ) (2024-02-27T16:15:28Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。