Fugu-MT 論文翻訳(概要): Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio

論文の概要: Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio

arxiv url: http://arxiv.org/abs/2509.11824v1
Date: Mon, 15 Sep 2025 12:10:50 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-16 17:26:23.264438
Title: Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio
Title（参考訳）: テキストによるAI生成音楽のデータ駆動分析--SunoとUdioを事例として
Authors: Luca Casini, Laura Cros Vila, David Dalmazzo, Anna-Kaisa Kaila, Bob L. T. Sturm,
Abstract要約: SunoやUdioといったテキストプロンプトから音楽を作成するためのオンラインAIプラットフォームが、現在数十万人のユーザによって使用されている。この記事では、2024年5月から10月にかけて、これらのプラットフォームのユーザが生成した大量の曲のコレクションを使用して、SunoとUdioに対するこれらの質問に答える。最先端のテキスト埋め込みモデルを組み合わせることで、プロンプト、タグ、歌詞を分析し、インタラクティブなプロットで自動的にアノテートおよび表示を行う。
参考スコア（独自算出の注目度）: 5.0238343960165155
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Online AI platforms for creating music from text prompts (AI music), such as Suno and Udio, are now being used by hundreds of thousands of users. Some AI music is appearing in advertising, and even charting, in multiple countries. How are these platforms being used? What subjects are inspiring their users? This article answers these questions for Suno and Udio using a large collection of songs generated by users of these platforms from May to October 2024. Using a combination of state-of-the-art text embedding models, dimensionality reduction and clustering methods, we analyze the prompts, tags and lyrics, and automatically annotate and display the processed data in interactive plots. Our results reveal prominent themes in lyrics, language preference, prompting strategies, as well as peculiar attempts at steering models through the use of metatags. To promote the musicological study of the developing cultural practice of AI-generated music we share our code and resources.
Abstract（参考訳）: SunoやUdioといったテキストプロンプト(AI音楽)から音楽を作成するためのオンラインAIプラットフォームが、現在数十万人のユーザによって使用されている。一部のAI音楽は、複数の国で広告やチャートに現れている。これらのプラットフォームはどのように使われていますか? ユーザを刺激するテーマは何か? この記事では、2024年5月から10月にかけて、これらのプラットフォームのユーザが生成した大量の曲のコレクションを使用して、SunoとUdioに対するこれらの質問に答える。我々は,最先端のテキスト埋め込みモデル,次元の低減とクラスタリング手法の組み合わせを用いて,プロンプト,タグ,歌詞を分析し,対話型プロットで処理されたデータを自動的に注釈・表示する。以上の結果から,歌詞,言語嗜好,促進戦略,メタタグの使用によるモデル操作の独特な試みなど,顕著なテーマが明らかになった。 AIが生み出す音楽の文化的実践に関する音楽学的研究を促進するために、私たちはコードとリソースを共有します。

関連論文リスト

Music and Artificial Intelligence: Artistic Trends [8.799402694043955]
ミュージシャンは、シングル、アルバム、パフォーマンス、声、バレエ、オペラ、サウンドトラックなど、さまざまなフォーマットで人工知能(AI)をどのように利用するかを研究する。 AI合成,共構成,音響設計,歌詞生成,翻訳の337の楽曲を収集し,AI使用率に基づいて分類する。
論文参考訳（メタデータ） (2025-08-12T18:12:02Z)
Music Discovery Dialogue Generation Using Human Intent Analysis and Large Language Models [10.022036983890091]
本稿では,多言語モデル(LLM)とユーザ意図,システム動作,音楽属性を用いたリッチな音楽発見対話のためのデータ生成フレームワークを提案する。このフレームワークをMario Songデータセットに適用することにより,大規模言語モデルに基づくPseudo Music DialogueデータセットであるLP-MusicDialogを作成する。評価の結果,人工音声データセットは,既存の小さな対話データセットと競合することがわかった。
論文参考訳（メタデータ） (2024-11-11T23:40:45Z)
Synthetic Lyrics Detection Across Languages and Genres [4.987546582439803]
音楽コンテンツ、特に歌詞を生成する大きな言語モデル(LLM)が人気を集めている。これまで様々な領域におけるコンテンツ検出について研究されてきたが、音楽におけるテキストのモダリティ、歌詞に焦点を当てた研究は行われていない。我々は、複数の言語、音楽ジャンル、アーティストのリアルとシンセサイザーの多様なデータセットをキュレートした。既存の合成テキスト検出手法について,未探索のデータ型である歌詞に対して,徹底的に評価を行った。音楽と産業の制約に従えば、これらのアプローチが言語全体にわたってどのように一般化され、データの可用性に配慮し、多言語言語コンテンツを処理し、数ショット設定で新しいジャンルで演奏するかを検討する。
論文参考訳（メタデータ） (2024-06-21T15:19:21Z)
MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文参考訳（メタデータ） (2023-06-18T12:56:46Z)
Youling: an AI-Assisted Lyrics Creation System [72.00418962906083]
本稿では,AIによる歌詞作成システムである textitYouling について紹介する。歌詞生成プロセスでは、textitYoulingは従来の1パスのフルテキスト生成モードとインタラクティブな生成モードをサポートする。システムは、ユーザーが望まない文や歌詞の言葉を繰り返し修正できるリビジョンモジュールも提供する。
論文参考訳（メタデータ） (2022-01-18T03:57:04Z)
Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文参考訳（メタデータ） (2020-10-28T02:35:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。