論文の概要: VietLyrics: A Large-Scale Dataset and Models for Vietnamese Automatic Lyrics Transcription
- arxiv url: http://arxiv.org/abs/2510.22295v1
- Date: Sat, 25 Oct 2025 13:38:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.026971
- Title: VietLyrics: A Large-Scale Dataset and Models for Vietnamese Automatic Lyrics Transcription
- Title(参考訳): VietLyrics:ベトナム語自動歌詞の大規模データセットとモデル
- Authors: Quoc Anh Nguyen, Bernard Cheng, Kelvin Soh,
- Abstract要約: ベトナム音楽のための自動歌詞転写(ALT)は、その音節の複雑さと方言のバリエーションにより、独特な課題を呈している。
ベトナム初の大規模ALTデータセット(VietLyrics)を作成した。
性能向上のために、VietLyricsデータセット上でWhisperモデルを微調整し、既存の多言語ALTシステムと比較して優れた結果を得た。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Lyrics Transcription (ALT) for Vietnamese music presents unique challenges due to its tonal complexity and dialectal variations, but remains largely unexplored due to the lack of a dedicated dataset. Therefore, we curated the first large-scale Vietnamese ALT dataset (VietLyrics), comprising 647 hours of songs with line-level aligned lyrics and metadata to address these issues. Our evaluation of current ASRbased approaches reveal significant limitations, including frequent transcription errors and hallucinations in non-vocal segments. To improve performance, we fine-tuned Whisper models on the VietLyrics dataset, achieving superior results compared to existing multilingual ALT systems, including LyricWhiz. We publicly release VietLyrics and our models, aiming to advance Vietnamese music computing research while demonstrating the potential of this approach for ALT in low-resource language and music.
- Abstract(参考訳): ベトナム音楽のための自動歌詞転写(ALT)は、その音節の複雑さと方言のバリエーションのために独特な課題を呈するが、専用のデータセットがないため、ほとんど探索されていない。
そこで,ベトナム初の大規模ALTデータセット (VietLyrics) を作成した。
ASRに基づく現在のアプローチの評価では,非声節における頻繁な書き起こし誤りや幻覚など,大きな限界がみられた。
性能向上のために、VietLyricsデータセット上でWhisperモデルを微調整し、LyricWhizを含む既存の多言語ALTシステムと比較して優れた結果を得た。
我々はベトナムの音楽コンピューティング研究の進展を目標とし、低リソース言語と音楽におけるALTのこのアプローチの可能性を示しながら、VietLyricsと我々のモデルを公開している。
関連論文リスト
- Towards Cultural Bridge by Bahnaric-Vietnamese Translation Using Transfer Learning of Sequence-To-Sequence Pre-training Language Model [0.24578723416255754]
この研究は、ベトナムの2つの民族集団を文化的にブリッジするために、バーナール語・ベトナム語訳を達成するための旅を探求する。
最も顕著な課題は、オリジナルのBahnaricリソースソース言語が不足していることである。
シーケンス・ツー・シーケンス・プレトレーニング言語モデルを用いた転送学習手法を利用する。
論文 参考訳(メタデータ) (2025-05-16T16:33:36Z) - LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT [48.28624219567131]
リリックウィズ(LyricWhiz)は、頑健で、多言語で、ゼロショットの自動歌詞書き起こし方式である。
我々は、弱教師付き頑健な音声認識モデルであるWhisperと、今日の最もパフォーマンスの高いチャットベースの大規模言語モデルであるGPT-4を使用している。
実験の結果,LyricWhizは英語の既存手法に比べて単語誤り率を大幅に低下させることがわかった。
論文 参考訳(メタデータ) (2023-06-29T17:01:51Z) - LyricSIM: A novel Dataset and Benchmark for Similarity Detection in
Spanish Song LyricS [52.77024349608834]
歌詞中の意味的類似性に合わせた新しいデータセットとベンチマークを提案する。
このデータセットはもともと2775組のスペイン語の歌で構成されており、63のネイティブアノテータによる集合アノテーション実験で注釈付けされました。
論文 参考訳(メタデータ) (2023-06-02T07:48:20Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z) - UIT-OpenViIC: A Novel Benchmark for Evaluating Image Captioning in
Vietnamese [2.9649783577150837]
ベトナムにおける新しい画像キャプションデータセット、UIT-OpenViICについて紹介する。
導入されたデータセットには、ベトナムでキャプチャーされ、厳格な規則と監督の下でベトナムによって手動で注釈付けされる複雑なシーンが含まれている。
我々のデータセットは、MS COCOデータセットでよく機能する、最近の最先端(SOTA)トランスフォーマーベースのベースラインに挑戦していることを示す。
論文 参考訳(メタデータ) (2023-05-07T02:48:47Z) - Revealing Weaknesses of Vietnamese Language Models Through Unanswerable
Questions in Machine Reading Comprehension [2.7528170226206443]
本稿では,現在のベトナム語モノリンガルモデルの言語弱さと強みを包括的に分析する。
またベトナムのMachine Readingベンチマークにおけるアーティファクトの存在を明らかにした。
提案した修正は,解決不可能な質問の品質向上に役立つ。
論文 参考訳(メタデータ) (2023-03-16T20:32:58Z) - A Vietnamese Dataset for Evaluating Machine Reading Comprehension [2.7528170226206443]
ベトナム語として低リソース言語のための新しいデータセットであるUIT-ViQuADを提案する。
このデータセットは、ウィキペディアから174のベトナム語記事の5,109節に基づいて、23,000人以上の人が生成した質問応答ペアで構成されている。
UIT-ViQuADの最初の実験モデルとして、英語と中国語の最先端MRC手法の実験を行った。
論文 参考訳(メタデータ) (2020-09-30T15:06:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。