Fugu-MT 論文翻訳(概要): A Comprehensive Survey for Evaluation Methodologies of AI-Generated Music

論文の概要: A Comprehensive Survey for Evaluation Methodologies of AI-Generated Music

arxiv url: http://arxiv.org/abs/2308.13736v1
Date: Sat, 26 Aug 2023 02:44:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-29 19:25:34.966637
Title: A Comprehensive Survey for Evaluation Methodologies of AI-Generated Music
Title（参考訳）: AI生成音楽の評価手法に関する総合調査
Authors: Zeyu Xiong, Weitao Wang, Jing Yu, Yue Lin, Ziyan Wang
Abstract要約: 本研究の目的は,AI生成音楽を評価するための主観的,客観的,複合的な方法論を包括的に評価することである。究極的には、音楽評価分野における生成的AIの統合のための貴重な参考資料を提供する。
参考スコア（独自算出の注目度）: 14.453416870193072
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In recent years, AI-generated music has made significant progress, with several models performing well in multimodal and complex musical genres and scenes. While objective metrics can be used to evaluate generative music, they often lack interpretability for musical evaluation. Therefore, researchers often resort to subjective user studies to assess the quality of the generated works, which can be resource-intensive and less reproducible than objective metrics. This study aims to comprehensively evaluate the subjective, objective, and combined methodologies for assessing AI-generated music, highlighting the advantages and disadvantages of each approach. Ultimately, this study provides a valuable reference for unifying generative AI in the field of music evaluation.
Abstract（参考訳）: 近年、AIが生成する音楽は大きな進歩を遂げ、複数のモデルがマルチモーダルな複雑な音楽ジャンルやシーンでうまく機能している。客観的な指標は生成的音楽の評価に使用できるが、しばしば音楽評価の解釈可能性に欠ける。そのため、研究者はしばしば主観的なユーザスタディを使って生成した作品の質を評価するが、これは客観的な指標よりもリソース集約的で再現性が低い。本研究の目的は,ai生成音楽を評価するための主観的,客観的,複合的手法を総合的に評価することであり,それぞれのアプローチの利点と欠点を強調することである。究極的には、この研究は音楽評価の分野で生成aiを統一するための貴重な参考となる。

関連論文リスト

Perception of AI-Generated Music - The Role of Composer Identity, Personality Traits, Music Preferences, and Perceived Humanness [0.0]
AI生成アートの急速な普及は、観客がそのような作品をどう認識し評価するかという潜在的なバイアスに関する議論を引き起こした。本研究では,作曲家の情報と聴取者の特性が,AI生成音楽の知覚をいかに形作るかを検討する。
論文参考訳（メタデータ） (2025-12-02T13:59:10Z)
Benchmarking Music Generation Models and Metrics via Human Preference Studies [18.95453617434051]
我々は、12の最先端モデルを用いて6k曲を生成し、2.5k人の被験者と15k対のオーディオ比較を行った。我々の知る限りでは、この研究は人間の好みに基づいて現在最先端の音楽生成モデルとメトリクスをランク付けする最初のものである。
論文参考訳（メタデータ） (2025-06-23T20:01:29Z)
Applications and Advances of Artificial Intelligence in Music Generation:A Review [0.04551615447454769]
本稿では,AI音楽生成における最新の研究成果を体系的にレビューする。主要な技術、モデル、データセット、評価方法、および様々な分野におけるそれらの実践的応用をカバーしている。
論文参考訳（メタデータ） (2024-09-03T13:50:55Z)
Foundation Models for Music: A Survey [77.77088584651268]
ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文参考訳（メタデータ） (2024-08-26T15:13:14Z)
Towards Explainable and Interpretable Musical Difficulty Estimation: A Parameter-efficient Approach [49.2787113554916]
音楽コレクションの整理には曲の難易度を推定することが重要である。シンボリックな音楽表現の難易度推定には説明可能な記述子を用いる。ピアノレパートリーで評価したアプローチは,平均2乗誤差(MSE)が1.7。
論文参考訳（メタデータ） (2024-08-01T11:23:42Z)
Between the AI and Me: Analysing Listeners' Perspectives on AI- and Human-Composed Progressive Metal Music [1.2874569408514918]
我々は,ロックミュージックをコントロールグループとして利用し,AIと人為的に生成するプログレッシブメタルに対する参加者の視点を探る。本稿では,世代タイプ(人間対AI),ジャンル(プログレッシブメタル対ロック),キュレーションプロセス(ランダム対チェリーピック)の効果を評価するための混合手法を提案する。本研究は,AI音楽生成におけるジャンル別特化を実現するために,ファインチューニングを用いたことを検証する。人間の音楽に類似した評価を受けるAI生成の抜粋はいくつかあったが、聴取者は人間の作曲を好んだ。
論文参考訳（メタデータ） (2024-07-31T14:03:45Z)
Towards Assessing Data Replication in Music Generation with Music Similarity Metrics on Raw Audio [25.254669525489923]
データ複製を評価するために,様々なオーディオ音楽類似度指標に基づくモデル非依存のオープン評価手法を提案する。提案手法は,10%以上の比率で正確なデータ複製を推定できることを示す。
論文参考訳（メタデータ） (2024-07-19T14:52:11Z)
Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文参考訳（メタデータ） (2024-05-13T14:44:22Z)
A Survey of Music Generation in the Context of Interaction [3.6522809408725223]
機械学習は、メロディーとポリフォニックの両方の曲の作曲と生成に成功している。これらのモデルのほとんどは、ライブインタラクションによる人間と機械の共創には適していない。
論文参考訳（メタデータ） (2024-02-23T12:41:44Z)
MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文参考訳（メタデータ） (2023-06-18T12:56:46Z)
Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文参考訳（メタデータ） (2023-06-18T09:54:33Z)
An Order-Complexity Model for Aesthetic Quality Assessment of Symbolic Homophony Music Scores [8.751312368054016]
AIが生み出す音楽の質は、人間の作曲家が生み出すものに比べれば比較的劣っている。本稿では,ホモフォニー楽譜の美的品質評価のための客観的定量的評価法を提案する。
論文参考訳（メタデータ） (2023-01-14T12:30:16Z)
Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文参考訳（メタデータ） (2022-11-21T07:19:17Z)
Multi-Modal Music Information Retrieval: Augmenting Audio-Analysis with Visual Computing for Improved Music Video Analysis [91.3755431537592]
この論文は、音声分析とコンピュータビジョンを組み合わせて、マルチモーダルの観点から音楽情報検索(MIR)タスクにアプローチする。本研究の主な仮説は、ジャンルやテーマなど特定の表現的カテゴリーを視覚的内容のみに基づいて認識できるという観察に基づいている。実験は、3つのMIRタスクに対して行われ、アーティスト識別、音楽ジェネア分類、クロスジェネア分類を行う。
論文参考訳（メタデータ） (2020-02-01T17:57:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。