論文の概要: HAIM: Human-AI Music Datasets for AI Music Production Tracking Benchmark
- arxiv url: http://arxiv.org/abs/2606.01686v1
- Date: Mon, 01 Jun 2026 04:51:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.373051
- Title: HAIM: Human-AI Music Datasets for AI Music Production Tracking Benchmark
- Title(参考訳): HAIM:AIミュージック制作追跡ベンチマークのためのヒューマンAIミュージックデータセット
- Authors: Seonghyeon Go, Yumin Kim,
- Abstract要約: 本稿では,音楽制作の段階において,多様なラベルを持つデータセットであるHAIMを紹介する。
最先端検出器の評価により, システム欠陥が明らかとなった。
- 参考スコア(独自算出の注目度): 1.7034813545878587
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As generative platforms such as Suno and Udio reach human-grade audio quality, the scope of AI's utility has expanded across the entire music production workflow. Beyond simple track generation, these advancements have catalyzed the adoption of AI-driven methodologies in diverse forms. These include vocal synthesis, arrangement, and professional mastering. However, current detection research remains largely confined to a binary `AI-or-human' paradigm. It fails to reflect the realities of contemporary music production workflows. In real-world production, AI tools are increasingly used to refine or master human-produced tracks, and human engineers likewise post-process AI-generated material to ensure professional quality. Moreover, users often employ adversarial tactics to bypass AI detectors, such as applying human mastering to AI-generated tracks. This creates a grey area that a simple binary classification fails to capture. In this paper, we define and investigate ``AI Music Tracking'': the challenge of identifying specific AI integration across the multifaceted spectrum of music production. To this end, we introduce HAIM, a dataset with diverse labels for stages of music production. It is designed to isolate stages of AI intervention, including hybrid production and agent-level tracking. Our evaluation of state-of-the-art detectors reveals systemic flaws. By releasing HAIM, we propose a new benchmark that shifts the field beyond binary classification toward a granular, structured evaluation of AI music.
- Abstract(参考訳): SunoやUdioといった生成プラットフォームが人間のグレードのオーディオ品質に達するにつれ、AIユーティリティのスコープは音楽制作ワークフロー全体にわたって拡大している。
単純なトラック生成以外にも、これらの進歩はAI駆動の方法論を様々な形で採用するきっかけとなった。
これには声楽合成、アレンジメント、プロのマスタリングが含まれる。
しかし、現在の検出研究は主に「AIまたは人間」のパラダイムに限られている。
これは現代の音楽制作のワークフローの現実を反映していない。
現実のプロダクションでは、AIツールは人間の制作したトラックを洗練またはマスターするためにますます使われており、人間のエンジニアも同様にAIが生成した素材を後処理して、プロフェッショナルな品質を保証する。
さらに、ユーザはAI生成トラックに人間のマスタリングを適用するなど、AI検出をバイパスするために敵の戦術を使うことが多い。
これにより、単純なバイナリ分類がキャプチャーに失敗するグレーな領域が生成される。
本稿では,音楽制作の多面的領域にわたる特定のAI統合を特定することの課題である'AI Music Tracking'を定義し,検討する。
この目的のために,音楽制作段階の多様なラベル付きデータセットであるHAIMを紹介する。
ハイブリッド生産やエージェントレベルのトラッキングを含む、AI介入のステージを分離するように設計されている。
最先端検出器の評価により, システム欠陥が明らかとなった。
HAIM のリリースにより,2進分類を超えて,AI 音楽の粒度的,構造化された評価に領域をシフトする新たなベンチマークを提案する。
関連論文リスト
- Skyra: AI-Generated Video Detection via Grounded Artifact Reasoning [66.51617619673587]
AI生成ビデオにおける人間の知覚可能な視覚的アーティファクトを識別する,特殊な大規模言語モデル(MLLM)であるSkyraを紹介する。
この目的を達成するために、我々は、人間のアノテーションを微粒化した最初の大規模AI生成ビデオデータセットである、Supervised Fine-Tuning (SFT)のためのViF-CoT-4Kを構築した。
次に,モデルの時間的知覚,説明能力,検出精度を体系的に向上する2段階のトレーニング戦略を開発する。
論文 参考訳(メタデータ) (2025-12-17T18:48:26Z) - Segment Transformer: AI-Generated Music Detection via Music Structural Analysis [1.7034813545878587]
我々は,音楽セグメントの構造パターンを分析し,AIGM検出の精度を向上させることを目的とする。
具体的には、短い音声クリップから音楽的特徴を抽出するために、様々な事前学習モデルを統合する。
ロングオーディオのために,楽曲をセグメントに分割し,セグメント間関係を学習するセグメント変換器を開発した。
論文 参考訳(メタデータ) (2025-09-10T04:56:40Z) - Detecting Musical Deepfakes [0.0]
本研究では,FakeMusicCapsデータセットを用いたAI生成楽曲の検出について検討した。
実世界の逆境条件をシミュレートするため, テンポストレッチとピッチシフトをデータセットに適用した。
メルスペクトログラムは、修正されたオーディオから生成され、その後、畳み込みニューラルネットワークのトレーニングと評価に使用された。
論文 参考訳(メタデータ) (2025-05-03T21:45:13Z) - Evaluating Human-AI Interaction via Usability, User Experience and Acceptance Measures for MMM-C: A Creative AI System for Music Composition [4.152843247686306]
本稿では,音楽作曲家のための共創型AIツールとして,MMM(Multi-Track Music Machine)のユーザ利用に関する徹底的な評価について報告する。
これを実現するために、我々は、Steinbergの人気のDigital Audio Workstation(DAW)であるCubaseにMMMを統合する。
本研究は,ユーザビリティ,ユーザエクスペリエンス,およびシステムの技術受容度を計測する3部構成の混合手法として,方法論の組立に貢献する。
論文 参考訳(メタデータ) (2025-04-18T20:41:02Z) - AI TrackMate: Finally, Someone Who Will Give Your Music More Than Just "Sounds Great!" [4.886175454381699]
本フレームワークでは,音楽分析モジュール,LCM可読音楽レポート,音楽制作指向フィードバック指導を統合した。
AI機能を独立したプロデューサのニーズに合わせてブリッジすることで、AI TrackMateはオンデマンドの分析フィードバックを提供する。
本システムは,独立系音楽制作の進化にともなう客観的自己評価ツールの需要の増大に対処する。
論文 参考訳(メタデータ) (2024-12-09T16:09:44Z) - Between the AI and Me: Analysing Listeners' Perspectives on AI- and Human-Composed Progressive Metal Music [1.2874569408514918]
我々は,ロックミュージックをコントロールグループとして利用し,AIと人為的に生成するプログレッシブメタルに対する参加者の視点を探る。
本稿では,世代タイプ(人間対AI),ジャンル(プログレッシブメタル対ロック),キュレーションプロセス(ランダム対チェリーピック)の効果を評価するための混合手法を提案する。
本研究は,AI音楽生成におけるジャンル別特化を実現するために,ファインチューニングを用いたことを検証する。
人間の音楽に類似した評価を受けるAI生成の抜粋はいくつかあったが、聴取者は人間の作曲を好んだ。
論文 参考訳(メタデータ) (2024-07-31T14:03:45Z) - Exploration with Principles for Diverse AI Supervision [88.61687950039662]
次世代の予測を用いた大規模トランスフォーマーのトレーニングは、AIの画期的な進歩を生み出した。
この生成AIアプローチは印象的な結果をもたらしたが、人間の監督に大きく依存している。
この人間の監視への強い依存は、AIイノベーションの進歩に重大なハードルをもたらす。
本稿では,高品質なトレーニングデータを自律的に生成することを目的とした,探索型AI(EAI)という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:03:39Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。