論文の概要: A Comprehensive Survey for Evaluation Methodologies of AI-Generated
Music
- arxiv url: http://arxiv.org/abs/2308.13736v1
- Date: Sat, 26 Aug 2023 02:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 19:25:34.966637
- Title: A Comprehensive Survey for Evaluation Methodologies of AI-Generated
Music
- Title(参考訳): AI生成音楽の評価手法に関する総合調査
- Authors: Zeyu Xiong, Weitao Wang, Jing Yu, Yue Lin, Ziyan Wang
- Abstract要約: 本研究の目的は,AI生成音楽を評価するための主観的,客観的,複合的な方法論を包括的に評価することである。
究極的には、音楽評価分野における生成的AIの統合のための貴重な参考資料を提供する。
- 参考スコア(独自算出の注目度): 14.453416870193072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, AI-generated music has made significant progress, with
several models performing well in multimodal and complex musical genres and
scenes. While objective metrics can be used to evaluate generative music, they
often lack interpretability for musical evaluation. Therefore, researchers
often resort to subjective user studies to assess the quality of the generated
works, which can be resource-intensive and less reproducible than objective
metrics. This study aims to comprehensively evaluate the subjective, objective,
and combined methodologies for assessing AI-generated music, highlighting the
advantages and disadvantages of each approach. Ultimately, this study provides
a valuable reference for unifying generative AI in the field of music
evaluation.
- Abstract(参考訳): 近年、AIが生成する音楽は大きな進歩を遂げ、複数のモデルがマルチモーダルな複雑な音楽ジャンルやシーンでうまく機能している。
客観的な指標は生成的音楽の評価に使用できるが、しばしば音楽評価の解釈可能性に欠ける。
そのため、研究者はしばしば主観的なユーザスタディを使って生成した作品の質を評価するが、これは客観的な指標よりもリソース集約的で再現性が低い。
本研究の目的は,ai生成音楽を評価するための主観的,客観的,複合的手法を総合的に評価することであり,それぞれのアプローチの利点と欠点を強調することである。
究極的には、この研究は音楽評価の分野で生成aiを統一するための貴重な参考となる。
関連論文リスト
- Applications and Advances of Artificial Intelligence in Music Generation:A Review [0.04551615447454769]
本稿では,AI音楽生成における最新の研究成果を体系的にレビューする。
主要な技術、モデル、データセット、評価方法、および様々な分野におけるそれらの実践的応用をカバーしている。
論文 参考訳(メタデータ) (2024-09-03T13:50:55Z) - Foundation Models for Music: A Survey [77.77088584651268]
ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。
本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文 参考訳(メタデータ) (2024-08-26T15:13:14Z) - Towards Explainable and Interpretable Musical Difficulty Estimation: A Parameter-efficient Approach [49.2787113554916]
音楽コレクションの整理には曲の難易度を推定することが重要である。
シンボリックな音楽表現の難易度推定には説明可能な記述子を用いる。
ピアノレパートリーで評価したアプローチは,平均2乗誤差(MSE)が1.7。
論文 参考訳(メタデータ) (2024-08-01T11:23:42Z) - Between the AI and Me: Analysing Listeners' Perspectives on AI- and Human-Composed Progressive Metal Music [1.2874569408514918]
我々は,ロックミュージックをコントロールグループとして利用し,AIと人為的に生成するプログレッシブメタルに対する参加者の視点を探る。
本稿では,世代タイプ(人間対AI),ジャンル(プログレッシブメタル対ロック),キュレーションプロセス(ランダム対チェリーピック)の効果を評価するための混合手法を提案する。
本研究は,AI音楽生成におけるジャンル別特化を実現するために,ファインチューニングを用いたことを検証する。
人間の音楽に類似した評価を受けるAI生成の抜粋はいくつかあったが、聴取者は人間の作曲を好んだ。
論文 参考訳(メタデータ) (2024-07-31T14:03:45Z) - Towards Assessing Data Replication in Music Generation with Music Similarity Metrics on Raw Audio [25.254669525489923]
データ複製を評価するために,様々なオーディオ音楽類似度指標に基づくモデル非依存のオープン評価手法を提案する。
提案手法は,10%以上の比率で正確なデータ複製を推定できることを示す。
論文 参考訳(メタデータ) (2024-07-19T14:52:11Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - A Survey of Music Generation in the Context of Interaction [3.6522809408725223]
機械学習は、メロディーとポリフォニックの両方の曲の作曲と生成に成功している。
これらのモデルのほとんどは、ライブインタラクションによる人間と機械の共創には適していない。
論文 参考訳(メタデータ) (2024-02-23T12:41:44Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - An Order-Complexity Model for Aesthetic Quality Assessment of Symbolic
Homophony Music Scores [8.751312368054016]
AIが生み出す音楽の質は、人間の作曲家が生み出すものに比べれば比較的劣っている。
本稿では,ホモフォニー楽譜の美的品質評価のための客観的定量的評価法を提案する。
論文 参考訳(メタデータ) (2023-01-14T12:30:16Z) - Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music
Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。
テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。
実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文 参考訳(メタデータ) (2022-11-21T07:19:17Z) - Multi-Modal Music Information Retrieval: Augmenting Audio-Analysis with
Visual Computing for Improved Music Video Analysis [91.3755431537592]
この論文は、音声分析とコンピュータビジョンを組み合わせて、マルチモーダルの観点から音楽情報検索(MIR)タスクにアプローチする。
本研究の主な仮説は、ジャンルやテーマなど特定の表現的カテゴリーを視覚的内容のみに基づいて認識できるという観察に基づいている。
実験は、3つのMIRタスクに対して行われ、アーティスト識別、音楽ジェネア分類、クロスジェネア分類を行う。
論文 参考訳(メタデータ) (2020-02-01T17:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。