論文の概要: MeloTune: On-Device Arousal Learning and Peer-to-Peer Mood Coupling for Proactive Music Curation
- arxiv url: http://arxiv.org/abs/2604.10815v2
- Date: Tue, 14 Apr 2026 02:07:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 14:01:13.410888
- Title: MeloTune: On-Device Arousal Learning and Peer-to-Peer Mood Coupling for Proactive Music Curation
- Title(参考訳): MeloTune: 積極的音楽キュレーションのためのデバイス上での覚醒学習とピアツーピア・ムード結合
- Authors: Hongwei Xu,
- Abstract要約: MeloTuneは、Mesh Memory Protocol (MMP) と Symbolic Attention Fusion (SVAF) をインスタンス化するiPhone対応の音楽エージェントである。
これは、MMP/SVAFの消費者向けモバイルハードウェアへの最初の製品展開である。
- 参考スコア(独自算出の注目度): 0.9494375075678443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: MeloTune is an iPhone-deployed music agent that instantiates the Mesh Memory Protocol (MMP) and Symbolic-Vector Attention Fusion (SVAF) as a production system for affect-aware music curation with peer-to-peer mood coupling. Each device runs two closed-form continuous-time (CfC) networks: a private listener-level CfC that predicts a short-horizon affective trajectory on Russell's circumplex and drives proactive curation, and a shared mesh-runtime CfC at MMP Layer 6 that integrates Cognitive Memory Blocks (CMBs) from co-listening peers. CfC hidden states never cross the wire; only structured CMBs do. A Personal Arousal Function (PAF) replaces the standard linear mapping from audio intensity to psychological arousal with a per-listener learned adjustment, trained from behavioral signals (skip, completion, favorite, volume) and from drift between user-declared mood and machine inference. The same track receives different arousal predictions for different listeners. The model (94,552 parameters) achieves trajectory MAE 0.414, pattern accuracy 96.6%, and intent accuracy 69.4% on held-out validation. PAF evidence from a live deployment session (46 observations across 11 genres) demonstrates that the learning loop operates end-to-end, with pop reaching full confidence after 22 observations. All inference runs on-device via CoreML. To our knowledge, this is the first production deployment of MMP/SVAF on consumer mobile hardware. The accompanying SDK (sym-swift v0.3.78, SYMCore v0.3.7) enforces strict protocol conformance. Music is the case study; the substrate is the contribution.
- Abstract(参考訳): MeloTune は、Mesh Memory Protocol (MMP) と Symbolic-Vector Attention Fusion (SVAF) を、ピアツーピアのムードカップリングによる影響認識音楽キュレーションのプロダクションシステムとしてインスタンス化する、iPhoneにデプロイされた音楽エージェントである。
各デバイスは2つのクローズドフォーム連続時間(CfC)ネットワークを動作させる: ラッセルの周囲の短水平感情軌道を予測し、プロアクティブなキュレーションを駆動するプライベートリスナレベルCfCと、コリスニングピアから認知メモリブロック(CMB)を統合するMMPレイヤ6で共有メッシュランタイムCfCである。
CfC隠された状態はワイヤーを渡ることはない。
個人覚醒関数(Personal Arousal Function, PAF)は、音声の強度から心理的覚醒への標準的な線形マッピングを、個人ごとの学習された調整に置き換え、行動信号(スキップ、完了、お気に入り、ボリューム)から学習し、ユーザ宣言された気分と機械推論の間のドリフトから学習する。
同じトラックは、異なるリスナーに対して異なる覚醒予測を受ける。
モデル(94,552パラメータ)は軌道MAE 0.414、パターン精度96.6%、意図精度69.4%を達成している。
ライブデプロイメントセッション(11分野にわたる46の観察)のPAFエビデンスでは、学習ループがエンドツーエンドで動作し、22の観察の後、ポップは完全な信頼を得る。
すべての推論はCoreMLを介してデバイス上で実行される。
私たちの知る限り、MMP/SVAFを消費者向けモバイルハードウェアにデプロイするのはこれが初めてです。
付属するSDK(sym-swift v0.3.78, SYMCore v0.3.7)は厳格なプロトコル準拠を強制する。
音楽はケーススタディであり、基質はコントリビューションである。
関連論文リスト
- Descriptor-Injected Cross-Modal Learning: A Systematic Exploration of Audio-MIDI Alignment via Spectral and Melodic Features [0.0]
音声録音とシンボリック音楽表現(MIDI)の相互検索は依然として困難である。
本研究は,手作りのドメイン特徴を持つモダリティ特異的エンコーダの拡張であるディスクリプタインジェクションについて検討する。
論文 参考訳(メタデータ) (2026-04-11T16:53:36Z) - Symbolic-Vector Attention Fusion for Collective Intelligence [0.9494375075678443]
本稿では,集団知能のための結合エンジンであるSybolic-pass Attention Fusion (SVAF)を紹介する。
SVAFは、各エージェント間の信号を7つの型付きセマンティックフィールドに分解し、学習された融合ゲートを通じてそれぞれを評価し、リミックスを生成する。
273のシナリオから237Kサンプルをトレーニングし、SVAFは78.7%の3クラス精度を達成した。
論文 参考訳(メタデータ) (2026-04-05T04:10:15Z) - Memo2496: Expert-Annotated Dataset and Dual-View Adaptive Framework for Music Emotion Recognition [57.869107847456725]
Music Emotion Recogniser (MER) の研究は、高品質なアノテートデータセットの制限と、クロストラック機能ドリフトに対処することの難しさにより、課題に直面している。
この研究は、これらの問題に対処するための2つの主要な貢献を示す。
論文 参考訳(メタデータ) (2025-12-16T01:34:03Z) - DMM: Distributed Matrix Mechanism for Differentially-Private Federated Learning Based on Constant-Overhead Linear Secret Resharing [51.336015600778396]
本稿では,ベスト・オブ・ボス・ワールドを実現するための分散行列機構,分散DPのプライバシ向上,行列機構の実用性向上について紹介する。
我々は、異なるトレーニングイテレーションのクライアント委員会間で、一定の通信オーバーヘッドで機密値をセキュアに転送する、新しい暗号プロトコルを用いてこれを実現する。
論文 参考訳(メタデータ) (2024-10-21T16:25:14Z) - LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation [49.89372182441713]
マルチモーダルコールドスタートプレイリスト継続モデルであるLARPを導入する。
我々のフレームワークはタスク固有の抽象化の段階を増大させており、イントラトラック(音声)コントラスト損失、トラックトラックコントラスト損失、トラックプレイリストコントラスト損失である。
論文 参考訳(メタデータ) (2024-06-20T14:02:15Z) - MDSC: Towards Evaluating the Style Consistency Between Music and Dance [16.08660802997222]
MDSCは、ダンスと音楽の一致の度合いを評価する最初の評価指標である。
生成したダンス・モーション・シーケンスとコンディショニング・ミュージック・シーケンスがいかにスタイリスティックに相関するかの尺度。
論文 参考訳(メタデータ) (2023-09-04T03:55:41Z) - Scalable Collaborative Learning via Representation Sharing [53.047460465980144]
フェデレートラーニング(FL)とスプリットラーニング(SL)は、データを(デバイス上で)プライベートにしながら協調学習を可能にする2つのフレームワークである。
FLでは、各データ保持者がモデルをローカルにトレーニングし、集約のために中央サーバにリリースする。
SLでは、クライアントは個々のカット層アクティベーション(スマッシュされたデータ)をサーバにリリースし、そのレスポンス(推論とバックの伝搬の両方)を待つ必要があります。
本研究では, クライアントがオンライン知識蒸留を通じて, 対照的な損失を生かして協調する, プライバシ保護機械学習の新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-20T10:49:22Z) - Singing-Tacotron: Global duration control attention and dynamic filter
for End-to-end singing voice synthesis [67.96138567288197]
本稿では,歌声合成フレームワークSinging-Tacotronを提案する。
提案フレームワークとTacotronの主な違いは、音声が楽譜の持続時間情報によって大きく制御できる点である。
論文 参考訳(メタデータ) (2022-02-16T07:35:17Z) - CWS-PResUNet: Music Source Separation with Channel-wise Subband
Phase-aware ResUNet [10.27705697219194]
近年の深層学習モデルでは,音楽音源分離(MSS)が活発に進展している。
チャネルワイドのサブバンド位相認識型ResUNet(CWS-PResUNet)モデルを提案し,信号をサブバンドに分解し,各ソースに対する非有界複素イデアル比マスク(cIRM)を推定する。
CWS-PResUNetは、チャネルワイドサブバンド機能を使用して、スペクトログラム上の不要なグローバルな重み共有を制限する。
論文 参考訳(メタデータ) (2021-12-09T03:42:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。