論文の概要: Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio
- arxiv url: http://arxiv.org/abs/2509.11824v1
- Date: Mon, 15 Sep 2025 12:10:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.264438
- Title: Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio
- Title(参考訳): テキストによるAI生成音楽のデータ駆動分析--SunoとUdioを事例として
- Authors: Luca Casini, Laura Cros Vila, David Dalmazzo, Anna-Kaisa Kaila, Bob L. T. Sturm,
- Abstract要約: SunoやUdioといったテキストプロンプトから音楽を作成するためのオンラインAIプラットフォームが、現在数十万人のユーザによって使用されている。
この記事では、2024年5月から10月にかけて、これらのプラットフォームのユーザが生成した大量の曲のコレクションを使用して、SunoとUdioに対するこれらの質問に答える。
最先端のテキスト埋め込みモデルを組み合わせることで、プロンプト、タグ、歌詞を分析し、インタラクティブなプロットで自動的にアノテートおよび表示を行う。
- 参考スコア(独自算出の注目度): 5.0238343960165155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online AI platforms for creating music from text prompts (AI music), such as Suno and Udio, are now being used by hundreds of thousands of users. Some AI music is appearing in advertising, and even charting, in multiple countries. How are these platforms being used? What subjects are inspiring their users? This article answers these questions for Suno and Udio using a large collection of songs generated by users of these platforms from May to October 2024. Using a combination of state-of-the-art text embedding models, dimensionality reduction and clustering methods, we analyze the prompts, tags and lyrics, and automatically annotate and display the processed data in interactive plots. Our results reveal prominent themes in lyrics, language preference, prompting strategies, as well as peculiar attempts at steering models through the use of metatags. To promote the musicological study of the developing cultural practice of AI-generated music we share our code and resources.
- Abstract(参考訳): SunoやUdioといったテキストプロンプト(AI音楽)から音楽を作成するためのオンラインAIプラットフォームが、現在数十万人のユーザによって使用されている。
一部のAI音楽は、複数の国で広告やチャートに現れている。
これらのプラットフォームはどのように使われていますか?
ユーザを刺激するテーマは何か?
この記事では、2024年5月から10月にかけて、これらのプラットフォームのユーザが生成した大量の曲のコレクションを使用して、SunoとUdioに対するこれらの質問に答える。
我々は,最先端のテキスト埋め込みモデル,次元の低減とクラスタリング手法の組み合わせを用いて,プロンプト,タグ,歌詞を分析し,対話型プロットで処理されたデータを自動的に注釈・表示する。
以上の結果から,歌詞,言語嗜好,促進戦略,メタタグの使用によるモデル操作の独特な試みなど,顕著なテーマが明らかになった。
AIが生み出す音楽の文化的実践に関する音楽学的研究を促進するために、私たちはコードとリソースを共有します。
関連論文リスト
- Lyrics Matter: Exploiting the Power of Learnt Representations for Music Popularity Prediction [47.3124073459729]
この研究は、人気を予想する上での歌詞の役割を過小評価するものである。
LLMを用いて高次元のリリック埋め込みを抽出する自動パイプラインを提案する。
これらの機能は、人気スコア予測のためにオーディオ、歌詞、ソーシャルメタデータを組み合わせたマルチモーダルアーキテクチャであるHitMusicLyricNetに統合されている。
論文 参考訳(メタデータ) (2025-12-05T08:09:26Z) - Music and Artificial Intelligence: Artistic Trends [8.799402694043955]
ミュージシャンは、シングル、アルバム、パフォーマンス、声、バレエ、オペラ、サウンドトラックなど、さまざまなフォーマットで人工知能(AI)をどのように利用するかを研究する。
AI合成,共構成,音響設計,歌詞生成,翻訳の337の楽曲を収集し,AI使用率に基づいて分類する。
論文 参考訳(メタデータ) (2025-08-12T18:12:02Z) - AI-Generated Song Detection via Lyrics Transcripts [15.1799390517192]
AIベースの音楽生成ツールの近年の能力向上は、音楽産業の隆盛を生み出している。
本稿では、一般的な自動音声認識(ASR)モデルを用いて曲を翻訳することで、このギャップを解決することを提案する。
我々の手法は、音声が様々な方法で摂動されるとき、最先端のオーディオベースよりも頑丈である。
論文 参考訳(メタデータ) (2025-06-23T10:42:50Z) - Music Discovery Dialogue Generation Using Human Intent Analysis and Large Language Models [10.022036983890091]
本稿では,多言語モデル(LLM)とユーザ意図,システム動作,音楽属性を用いたリッチな音楽発見対話のためのデータ生成フレームワークを提案する。
このフレームワークをMario Songデータセットに適用することにより,大規模言語モデルに基づくPseudo Music DialogueデータセットであるLP-MusicDialogを作成する。
評価の結果,人工音声データセットは,既存の小さな対話データセットと競合することがわかった。
論文 参考訳(メタデータ) (2024-11-11T23:40:45Z) - MuChoMusic: Evaluating Music Understanding in Multimodal Audio-Language Models [11.834712543531756]
MuChoMusicは、オーディオに焦点を当てたマルチモーダル言語モデルにおける音楽理解を評価するためのベンチマークである。
これには1,187の質問が含まれており、いずれも人間のアノテータによって検証され、2つのパブリックな音楽データセットからソースされた644曲の楽曲が収録されている。
我々は5つのオープンソースモデルを評価し、言語モダリティの過度な信頼性を含むいくつかの落とし穴を識別する。
論文 参考訳(メタデータ) (2024-08-02T15:34:05Z) - Synthetic Lyrics Detection Across Languages and Genres [4.987546582439803]
音楽コンテンツ、特に歌詞を生成する大きな言語モデル(LLM)が人気を集めている。
これまで様々な領域におけるコンテンツ検出について研究されてきたが、音楽におけるテキストのモダリティ、歌詞に焦点を当てた研究は行われていない。
我々は、複数の言語、音楽ジャンル、アーティストのリアルとシンセサイザーの多様なデータセットをキュレートした。
既存の合成テキスト検出手法について,未探索のデータ型である歌詞に対して,徹底的に評価を行った。
音楽と産業の制約に従えば、これらのアプローチが言語全体にわたってどのように一般化され、データの可用性に配慮し、多言語言語コンテンツを処理し、数ショット設定で新しいジャンルで演奏するかを検討する。
論文 参考訳(メタデータ) (2024-06-21T15:19:21Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z) - Youling: an AI-Assisted Lyrics Creation System [72.00418962906083]
本稿では,AIによる歌詞作成システムである textitYouling について紹介する。
歌詞生成プロセスでは、textitYoulingは従来の1パスのフルテキスト生成モードとインタラクティブな生成モードをサポートする。
システムは、ユーザーが望まない文や歌詞の言葉を繰り返し修正できるリビジョンモジュールも提供する。
論文 参考訳(メタデータ) (2022-01-18T03:57:04Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。