Fugu-MT 論文翻訳(概要): Prevailing Research Areas for Music AI in the Era of Foundation Models

論文の概要: Prevailing Research Areas for Music AI in the Era of Foundation Models

arxiv url: http://arxiv.org/abs/2409.09378v1
Date: Sat, 14 Sep 2024 09:06:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-17 20:57:09.145190
Title: Prevailing Research Areas for Music AI in the Era of Foundation Models
Title（参考訳）: ファンデーションモデルにおける音楽AI研究の主流
Authors: Megan Wei, Mateusz Modrzejewski, Aswin Sivaraman, Dorien Herremans,
Abstract要約: 過去数年間、生成的音楽AIアプリケーションが急増している。音楽データセットの現状とその限界について論じる。複数のモダリティへの拡張とアーティストのワークフローとの統合に向けて,これらの生成モデルの応用を強調した。
参考スコア（独自算出の注目度）: 8.067636023395236
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In tandem with the recent advancements in foundation model research, there has been a surge of generative music AI applications within the past few years. As the idea of AI-generated or AI-augmented music becomes more mainstream, many researchers in the music AI community may be wondering what avenues of research are left. With regards to music generative models, we outline the current areas of research with significant room for exploration. Firstly, we pose the question of foundational representation of these generative models and investigate approaches towards explainability. Next, we discuss the current state of music datasets and their limitations. We then overview different generative models, forms of evaluating these models, and their computational constraints/limitations. Subsequently, we highlight applications of these generative models towards extensions to multiple modalities and integration with artists' workflow as well as music education systems. Finally, we survey the potential copyright implications of generative music and discuss strategies for protecting the rights of musicians. While it is not meant to be exhaustive, our survey calls to attention a variety of research directions enabled by music foundation models.
Abstract（参考訳）: ファンデーションモデル研究の最近の進歩と相まって、ここ数年で生成的音楽AI応用が急増している。 AIが生成し、AIが強化された音楽が主流になるにつれ、音楽のAIコミュニティの多くの研究者は、どんな研究の道が残されているのか疑問に思うかもしれない。音楽生成モデルに関しては,現在研究対象となっている領域について概説する。まず、これらの生成モデルの基礎的表現の問題を提起し、説明可能性へのアプローチを検討する。次に,音楽データセットの現状とその限界について論じる。次に、異なる生成モデル、これらのモデルの評価形式、およびそれらの計算制約/制限について概説する。続いて、これらの生成モデルの複数のモダリティ拡張への応用と、アーティストのワークフローと音楽教育システムとの統合を強調した。最後に、生成音楽の著作権侵害の可能性を調査し、音楽家の権利を守るための戦略について議論する。本調査では,音楽ファンデーションモデルによる様々な研究の方向性に注目した。

関連論文リスト

Vision-to-Music Generation: A Survey [10.993775589904251]
ヴィジュアル・ツー・ミュージック・ジェネレーションは、映画スコアリング、ショートビデオ作成、ダンス音楽の合成といった分野における大きな応用可能性を示している。ヴィジュアル・ツー・ミュージックの研究は、複雑な内部構造とビデオとの動的関係のモデル化が難しいため、まだ初期段階にある。既存の調査では、ヴィジュアル・ツー・ミュージックに関する包括的な議論をすることなく、一般的な音楽生成に焦点を当てている。
論文参考訳（メタデータ） (2025-03-27T08:21:54Z)
A Multimodal Symphony: Integrating Taste and Sound through Generative AI [1.2749527861829049]
本稿では味覚情報を音楽に変換するマルチモーダル生成モデルについて述べる。本稿では,各楽曲に提供される詳細な味覚記述に基づいて,音楽生成モデル(MusicGEN)の微調整版を用いて音楽を生成する実験を行う。
論文参考訳（メタデータ） (2025-03-04T17:48:48Z)
A Survey of Foundation Models for Music Understanding [60.83532699497597]
この研究は、AI技術と音楽理解の交差に関する初期のレビューの1つである。音楽理解能力に関して,近年の大規模音楽基盤モデルについて検討,分析,検証を行った。
論文参考訳（メタデータ） (2024-09-15T03:34:14Z)
Foundation Models for Music: A Survey [77.77088584651268]
ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文参考訳（メタデータ） (2024-08-26T15:13:14Z)
Deep Generative Models in Robotics: A Survey on Learning from Multimodal Demonstrations [52.11801730860999]
近年、ロボット学習コミュニティは、大規模なデータセットの複雑さを捉えるために、深層生成モデルを使うことへの関心が高まっている。本稿では,エネルギーベースモデル,拡散モデル,アクションバリューマップ,生成的敵ネットワークなど,コミュニティが探求してきたさまざまなモデルについて述べる。また,情報生成から軌道生成,コスト学習に至るまで,深層生成モデルを用いた様々なアプリケーションについて述べる。
論文参考訳（メタデータ） (2024-08-08T11:34:31Z)
Reducing Barriers to the Use of Marginalised Music Genres in AI [7.140590440016289]
このプロジェクトの目的は、AIモデルで疎外された音楽のジャンルを使用する際の障壁を減らすことに関連する、eXplainable AI(XAI)の課題と機会を探ることである。特定されたXAIの機会には、AIモデルの透明性とコントロールの改善、AIモデルの倫理とバイアスの説明、バイアスを減らすために小さなデータセットで大規模モデルの微調整、AIモデルによるスタイル移行の機会の説明などが含まれる。私たちは現在、グローバルなInternational Responsible AI Musicコミュニティをまとめて、私たちのネットワークへの参加を招待するために、このプロジェクトを構築しています。
論文参考訳（メタデータ） (2024-07-18T12:10:04Z)
MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文参考訳（メタデータ） (2024-04-09T15:35:52Z)
Exploring Variational Auto-Encoder Architectures, Configurations, and Datasets for Generative Music Explainable AI [7.391173255888337]
音楽と芸術のための生成AIモデルは、ますます複雑で理解しづらい。生成AIモデルをより理解しやすいものにするためのアプローチの1つは、生成AIモデルに少数の意味的に意味のある属性を課すことである。本稿では,変分自動エンコーダモデル(MeasureVAEとAdversarialVAE)の異なる組み合わせが音楽生成性能に与える影響について,系統的な検討を行った。
論文参考訳（メタデータ） (2023-11-14T17:27:30Z)
An Autoethnographic Exploration of XAI in Algorithmic Composition [7.775986202112564]
本稿では,アイルランド音楽で学習した潜在次元の解釈可能な測度VeE生成音楽XAIモデルを用いた自己エスノグラフィー研究を紹介する。音楽作成ワークフローの探索的性質は、生成モデル自体の特徴ではなく、トレーニングデータセットの音楽的特徴を前提としていることが示唆されている。
論文参考訳（メタデータ） (2023-08-11T12:03:17Z)
MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文参考訳（メタデータ） (2023-06-18T12:56:46Z)
A Survey on Artificial Intelligence for Music Generation: Agents, Domains and Perspectives [10.349825060515181]
人間がどのように音楽を作曲し、新しいAIシステムがそのようなプロセスを模倣するかを説明する。 AIモデルとアルゴリズムがいかにして音楽を生成するかを理解するために、私たちは、音楽生成プロセスに参加するエージェントを探索、分析、記述する。
論文参考訳（メタデータ） (2022-10-25T11:54:30Z)
Artificial Musical Intelligence: A Survey [51.477064918121336]
音楽は、機械学習と人工知能研究の領域としてますます広まりつつある。この記事では、音楽知能の定義を提供し、その構成成分の分類を導入し、その追求に耐えうる幅広いAI手法を調査します。
論文参考訳（メタデータ） (2020-06-17T04:46:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。