論文の概要: Missing Melodies: AI Music Generation and its "Nearly" Complete Omission of the Global South
- arxiv url: http://arxiv.org/abs/2412.04100v1
- Date: Thu, 05 Dec 2024 12:10:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-06 14:42:51.788171
- Title: Missing Melodies: AI Music Generation and its "Nearly" Complete Omission of the Global South
- Title(参考訳): 行方不明のメロディー:AI音楽生成と世界南部の「初期段階」の完全なオミッション
- Authors: Atharva Mehta, Shivam Chauhan, Monojit Choudhury,
- Abstract要約: 我々はAI音楽生成研究に使用される100万時間以上の音声データセットの分析を行った。
我々は,AI研究において,グローバル・サウスの音楽ジャンルの公平な表現と包括性において重要なギャップを見出した。
これらのデータセットの約40%には、西洋音楽以外の形態が含まれており、グローバル・サウスのジャンルは14.6%に過ぎない。
- 参考スコア(独自算出の注目度): 9.230532392213613
- License:
- Abstract: Recent advances in generative AI have sparked renewed interest and expanded possibilities for music generation. However, the performance and versatility of these systems across musical genres are heavily influenced by the availability of training data. We conducted an extensive analysis of over one million hours of audio datasets used in AI music generation research and manually reviewed more than 200 papers from eleven prominent AI and music conferences and organizations (AAAI, ACM, EUSIPCO, EURASIP, ICASSP, ICML, IJCAI, ISMIR, NeurIPS, NIME, SMC) to identify a critical gap in the fair representation and inclusion of the musical genres of the Global South in AI research. Our findings reveal a stark imbalance: approximately 86% of the total dataset hours and over 93% of researchers focus primarily on music from the Global North. However, around 40% of these datasets include some form of non-Western music, genres from the Global South account for only 14.6% of the data. Furthermore, approximately 51% of the papers surveyed concentrate on symbolic music generation, a method that often fails to capture the cultural nuances inherent in music from regions such as South Asia, the Middle East, and Africa. As AI increasingly shapes the creation and dissemination of music, the significant underrepresentation of music genres in datasets and research presents a serious threat to global musical diversity. We also propose some important steps to mitigate these risks and foster a more inclusive future for AI-driven music generation.
- Abstract(参考訳): 生成AIの最近の進歩は、新たな関心を呼び起こし、音楽生成の可能性を広げている。
しかし,これらのシステムの性能と汎用性は,学習データの利用に大きく影響している。
我々は、AI音楽生成研究に使用される100万時間以上のオーディオデータセットを広範囲に分析し、AI研究におけるグローバル・サウスの音楽ジャンルの公正な表現と包括性において重要なギャップを明らかにするために、11の著名なAIおよび音楽会議(AAAI, ACM, EUSIPCO, EURASIP, ICASSP, ICML, IJCAI, ISMIR, NeurIPS, NIME, SMC)から200以上の論文を手動でレビューした。
総データセットの86%、研究者の93%は、主にグローバル・ノースの音楽に焦点を当てています。
しかしながら、これらのデータセットの約40%には西欧音楽のある種の形態が含まれており、グローバル・サウスのジャンルはわずか14.6%である。
さらに、調査対象となった論文の約51%は、南アジア、中東、アフリカなど、音楽に固有の文化的ニュアンスをつかむのにしばしば失敗する象徴的な音楽生成に焦点を当てている。
AIが音楽の創造と普及をますます進めるにつれて、データセットや研究における音楽ジャンルの顕著な過小評価は、世界的な音楽の多様性に対する深刻な脅威を示している。
また、これらのリスクを軽減し、AIによる音楽生成のより包括的な未来を育むための重要なステップも提案する。
関連論文リスト
- A Survey of Foundation Models for Music Understanding [60.83532699497597]
この研究は、AI技術と音楽理解の交差に関する初期のレビューの1つである。
音楽理解能力に関して,近年の大規模音楽基盤モデルについて検討,分析,検証を行った。
論文 参考訳(メタデータ) (2024-09-15T03:34:14Z) - Prevailing Research Areas for Music AI in the Era of Foundation Models [8.067636023395236]
過去数年間、生成的音楽AIアプリケーションが急増している。
音楽データセットの現状とその限界について論じる。
複数のモダリティへの拡張とアーティストのワークフローとの統合に向けて,これらの生成モデルの応用を強調した。
論文 参考訳(メタデータ) (2024-09-14T09:06:43Z) - Foundation Models for Music: A Survey [77.77088584651268]
ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。
本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文 参考訳(メタデータ) (2024-08-26T15:13:14Z) - Reducing Barriers to the Use of Marginalised Music Genres in AI [7.140590440016289]
このプロジェクトの目的は、AIモデルで疎外された音楽のジャンルを使用する際の障壁を減らすことに関連する、eXplainable AI(XAI)の課題と機会を探ることである。
特定されたXAIの機会には、AIモデルの透明性とコントロールの改善、AIモデルの倫理とバイアスの説明、バイアスを減らすために小さなデータセットで大規模モデルの微調整、AIモデルによるスタイル移行の機会の説明などが含まれる。
私たちは現在、グローバルなInternational Responsible AI Musicコミュニティをまとめて、私たちのネットワークへの参加を招待するために、このプロジェクトを構築しています。
論文 参考訳(メタデータ) (2024-07-18T12:10:04Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - Analyzing Musical Characteristics of National Anthems in Relation to Global Indices [0.0]
国歌音楽データを分析し、特定の音楽特性が平和、幸福、自殺率、犯罪率などと関連しているかどうかを判定する。
以上の結果から,国歌の楽曲的特徴と,調査対象の指標との間には相関があることが示唆された。
論文 参考訳(メタデータ) (2024-04-04T17:25:31Z) - Can MusicGen Create Training Data for MIR Tasks? [3.8980564330208662]
我々は,AIに基づく生成音楽システムを用いて音楽情報検索タスクの学習データを生成するという,より広範な概念について検討している。
我々は50000以上のジャンルを規定したテキスト記述を構築し、5つのジャンルをカバーした楽曲の抜粋を作成した。
予備的な結果は,提案モデルが実世界の音楽録音を一般化した人工音楽トラックからジャンル特有な特徴を学習できることを示唆している。
論文 参考訳(メタデータ) (2023-11-15T16:41:56Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - Universality of preference behaviors in online music-listener bipartite
networks: A Big Data analysis [4.062544367625752]
中国最大のオンライン音楽プラットフォームの一つであるNetEase Cloud Music (NCM) の何百万人ものユーザによる音楽嗜好の形成について検討する。
本分析では,音楽影響の減衰パターン,音楽に対するユーザの感受性,年齢・性別差,地域経済指標との関係について考察した。
論文 参考訳(メタデータ) (2022-12-26T12:50:56Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z) - Artificial Musical Intelligence: A Survey [51.477064918121336]
音楽は、機械学習と人工知能研究の領域としてますます広まりつつある。
この記事では、音楽知能の定義を提供し、その構成成分の分類を導入し、その追求に耐えうる幅広いAI手法を調査します。
論文 参考訳(メタデータ) (2020-06-17T04:46:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。