論文の概要: MindMelody: A Closed-Loop EEG-Driven System for Personalized Music Intervention
- arxiv url: http://arxiv.org/abs/2605.01235v1
- Date: Sat, 02 May 2026 04:15:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.657947
- Title: MindMelody: A Closed-Loop EEG-Driven System for Personalized Music Intervention
- Title(参考訳): MindMelody:パーソナライズド・ミュージック・インターベンションのためのクローズドループ脳波駆動システム
- Authors: Yimeng Zhang, Yueru Sun, Haoyu Gu,
- Abstract要約: MindMelodyは、EEGによるパーソナライズされた音楽介入のための、完全に機能し、クローズドループのリアルタイムシステムである。
ハイブリッドトランスフォーマー-GNNは、リアルタイム脳波信号を大域的バレンス-覚醒状態と局所的時間的影響軌道にデコードする。
新たなEEGコントローラは、事前訓練された音楽バックボーンに、グローバルな影響プレフィックスと局所的な時間的ガイダンスを注入し、きめ細かい制御可能なオーディオ合成を可能にする。
- 参考スコア(独自算出の注目度): 10.174228693357568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Driven by the escalating global burden of mental health conditions, music-based interventions have attracted significant attention as a non-invasive, cost-effective modality for emotion regulation and psychological stress relief. However, current digital music services rely on static preferences and fail to adapt to users' instantaneous psychological states. Furthermore, directly mapping electroencephalography (EEG) to music generation remains challenging due to severe paired-data scarcity and a lack of interpretability. To address these limitations, we propose MindMelody, a fully functional, closed-loop real-time system for EEG-driven personalized music intervention. MindMelody introduces an emotion-mediated semantic bridge. Specifically, a hybrid Transformer-GNN first decodes real-time EEG signals into global Valence-Arousal states and local temporal affect trajectories. These states are then fed into a Retrieval-Augmented Generation (RAG)-equipped Large Language Model (LLM) to formulate structured intervention plans. Subsequently, a novel Hierarchical EEG Controller injects global affect prefixes and local temporal guidance into a pretrained music backbone, enabling fine-grained controllable audio synthesis. Crucially, the system incorporates a continuous feedback loop that updates generation parameters on the fly based on the user's evolving EEG dynamics. Extensive experiments show that MindMelody improves control adherence and emotional alignment, and receives higher perceived helpfulness in a short-term listening setting, suggesting its promise as an adaptive affect-aware music generation framework.
- Abstract(参考訳): メンタルヘルスのグローバルな負担の増大によって、音楽に基づく介入は、感情の規制や心理的ストレス軽減のための非侵襲的で費用対効果のないモダリティとして、大きな注目を集めている。
しかし、現在のデジタル音楽サービスは静的な好みに依存しており、ユーザの瞬間的な心理的状態に適応できない。
さらに、電子脳波(EEG)を直接音楽生成にマッピングすることは、重度のペアリングデータ不足と解釈可能性の欠如により、依然として困難である。
これらの制約に対処するために,脳波によるパーソナライズされた音楽介入のための完全機能的でクローズドループリアルタイムシステムであるMindMelodyを提案する。
MindMelodyは感情を介するセマンティックブリッジを導入する。
具体的には、Transformer-GNNのハイブリッドが、まずリアルタイムの脳波信号をグローバルなValence-Arousal状態と局所的な時間的影響軌道にデコードする。
これらの状態は、構造化された介入計画を定式化するために、RAG(Retrieval-Augmented Generation)を備えたLarge Language Model(LLM)に入力される。
その後、新しい階層型脳波制御器は、事前訓練された音楽バックボーンに大域的影響プレフィックスと局所的時間的ガイダンスを注入し、きめ細かい制御可能なオーディオ合成を可能にする。
重要なのは、ユーザの進化するEEGダイナミクスに基づいて、生成パラメータをリアルタイムで更新する継続的フィードバックループが組み込まれていることだ。
広汎な実験により,MindMelodyはコントロールの順応性や情緒的アライメントを改善し,短時間の聴取環境において高い感性を受け,適応的な感情認識音楽生成フレームワークとしての可能性を示唆した。
関連論文リスト
- AUHead: Realistic Emotional Talking Head Generation via Action Units Control [67.20660861826357]
リアルなトークヘッドビデオ生成は、仮想アバター、映画制作、インタラクティブシステムにとって重要である。
現在の方法は、きめ細かい感情制御が欠如しているため、ニュアンス的な感情表現に苦慮している。
本稿では、音声から感情制御、すなわちアクションユニット(AU)をアンタングルし、制御可能な生成を実現するための新しい2段階手法を提案する。
論文 参考訳(メタデータ) (2026-02-10T08:45:51Z) - BREATH: A Bio-Radar Embodied Agent for Tonal and Human-Aware Diffusion Music Generation [3.2646887494398205]
生理的センシング, LLMに基づく推論, 制御可能な音声合成を統合した, パーソナライズされた音楽生成のためのマルチモーダルシステムを提案する。
ミリ波レーダセンサは、非侵襲的に心拍数と呼吸速度をキャプチャする。
これらの生理的信号は、テンポ、ムード強度、伝統的な中国の五音音モードといった象徴的な音楽記述子を推論する推論エージェントによって解釈される。
論文 参考訳(メタデータ) (2025-09-09T12:26:20Z) - EmoCAST: Emotional Talking Portrait via Emotive Text Description [56.42674612728354]
EmoCASTは、正確なテキスト駆動感情合成のための拡散ベースのフレームワークである。
外観モデリングでは、感情的なプロンプトはテキスト誘導の分離された感情的モジュールを通して統合される。
EmoCASTは、現実的で感情的に表現され、音声同期されたトーキーヘッドビデオを生成する、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-08-28T10:02:06Z) - Wearable Music2Emotion : Assessing Emotions Induced by AI-Generated Music through Portable EEG-fNIRS Fusion [11.122272456519227]
MEEtBrainは、感情分析のためのポータブルでマルチモーダルなフレームワークである
それは、AIが生成した音楽刺激とEEG-fNIRSの買収をワイヤレスヘッドバンドを介して統合する。
フレームワークの有効性を検証するため、20人の参加者による14時間のデータセットが収集された。
論文 参考訳(メタデータ) (2025-08-05T12:25:35Z) - EditGen: Harnessing Cross-Attention Control for Instruction-Based Auto-Regressive Audio Editing [54.10773655199149]
自動回帰モデルにおける効率的な音声編集のためのクロスアテンション制御の活用について検討する。
画像編集手法に触発されて,横断的・自己認識的メカニズムを通じて編集をガイドするPrompt-to-Promptライクなアプローチを開発した。
論文 参考訳(メタデータ) (2025-07-15T08:44:11Z) - FreqDGT: Frequency-Adaptive Dynamic Graph Networks with Transformer for Cross-subject EEG Emotion Recognition [1.9198890060313585]
クロスオブジェクトの一般化は、個人の多様性、認知的特徴、感情的な反応による課題である。
本稿では,周波数適応型動的グラフ変換器FreqDGTを提案する。
FreqDGTは、周波数適応性、空間力学、時間階層モデリングの統合の有効性を確認することにより、物体間感情認識の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2025-06-28T08:18:05Z) - Extending Visual Dynamics for Video-to-Music Generation [51.274561293909926]
DyViMは、ビデオから音楽への生成のための動的モデリングを強化する新しいフレームワークである。
高レベルのセマンティクスは、クロスアテンションメカニズムを通じて伝達される。
実験では、DyViMが最先端(SOTA)法よりも優れていることを示した。
論文 参考訳(メタデータ) (2025-04-10T09:47:26Z) - MuseBarControl: Enhancing Fine-Grained Control in Symbolic Music Generation through Pre-Training and Counterfactual Loss [51.85076222868963]
制御信号と対応する音楽トークンを直接リンクする事前学習タスクを導入する。
次に、生成した音楽と制御プロンプトとの整合性を向上する新たな対実的損失を実現する。
論文 参考訳(メタデータ) (2024-07-05T08:08:22Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。