論文の概要: Music Playlist Captioning at Scale with Large Language Models
- arxiv url: http://arxiv.org/abs/2606.22460v1
- Date: Sun, 21 Jun 2026 12:08:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 14:52:38.025203
- Title: Music Playlist Captioning at Scale with Large Language Models
- Title(参考訳): 大規模言語モデルによる大規模音楽プレイリストのキャプション
- Authors: Mathieu Delcluze, Léa Briand, Benjamin Chapus, Deniz Mekik, Guillaume Salha-Galvan,
- Abstract要約: 本稿では2025年にDeezer上に展開された自動プレイリストキャプションシステムについて述べる。
本システムは、多様なデータソースから記述キャプションを制御された方法で生成する。
このデプロイメントにより、ユーザエンゲージメントが大幅に向上した。
- 参考スコア(独自算出の注目度): 1.0262304700896199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Music streaming services such as Deezer often recommend personalized playlists to users. Playlist captioning, which involves describing these playlists in natural language, is essential for helping users understand the content behind each recommendation, yet remains challenging at scale. This paper presents the automatic playlist captioning system deployed on Deezer in 2025 to address this challenge. Leveraging recent advances in large language models (LLMs) to generate descriptive captions from diverse data sources in a controlled manner, this system now powers the Daily Mix feature, used by millions of users. This deployment has led to significant improvements in user engagement, highlighting how the semantic framing of an unchanged recommendation shapes user perception in online personalized experiences.
- Abstract(参考訳): Deezerのような音楽ストリーミングサービスは、ユーザーに対してパーソナライズされたプレイリストを推奨することが多い。
プレイリストのキャプションは、これらのプレイリストを自然言語で記述することで、ユーザーがそれぞれのレコメンデーションの背後にあるコンテンツを理解するのを助けるのに不可欠だが、規模は依然として難しい。
本稿では,2025年にDeezer上に展開された自動プレイリストキャプションシステムについて述べる。
近年の大規模言語モデル(LLM)の進歩を活用して,多様なデータソースから記述キャプションを制御的に生成するシステムであるDaily Mixは,数百万のユーザが使用している機能である。
このデプロイメントによって、ユーザのエンゲージメントが大幅に向上し、リコメンデーションのセマンティックフレーミングが、オンラインパーソナライズされたエクスペリエンスにおけるユーザの認識をいかに形作るかを強調した。
関連論文リスト
- SongSage: A Large Musical Language Model with Lyric Generative Pre-training [69.52790104805794]
SongSageは、多種多様な歌詞中心のインテリジェンスを備えた大規模な音楽モデルである。
SongSageは歌詞中心の知識を強く理解し、ゼロショットプレイリストのレコメンデーションのためにユーザークエリを書き直し、歌詞を効果的に生成し、継続し、7つの追加機能で巧みに実行する。
論文 参考訳(メタデータ) (2026-01-03T10:54:37Z) - Just Ask for Music (JAM): Multimodal and Personalized Natural Language Music Recommendation [47.05078668091976]
我々は、自然言語音楽レコメンデーションのための軽量で直感的なフレームワークであるJAM(Just Ask for Music)を提示する。
音楽とユーザ意図の複雑さを捉えるため、JAMはクロスアテンションとスパース・ミックス・オブ・エキスパートを通じてマルチモーダルアイテムの特徴を集約する。
JAMは正確なレコメンデーションを提供し、実用的なユースケースに適した直感的な表現を生成し、既存のレコメンデーションスタックと容易に統合できることを示す。
論文 参考訳(メタデータ) (2025-07-21T17:36:03Z) - TALKPLAY: Multimodal Music Recommendation with Large Language Models [6.830154140450626]
大規模言語モデル(LLM)を用いたトークン生成問題としてレコメンデーションを再構成する新しいマルチモーダル音楽レコメンデーションシステムTALKPLAYを提案する。
本システムは,コンテキストに関連のある応答を生成しながら,多様なユーザクエリから楽曲を効果的に推薦する。
質的,定量的評価により,TALKPLAYは,推奨性能と会話自然性の両方において,テキストや聴取履歴のみに基づく一助的アプローチを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2025-02-19T13:28:20Z) - Text2Playlist: Generating Personalized Playlists from Text on Deezer [1.5558822250482192]
Text2PlaylistはDeezerのスタンドアロンツールである。
クエリ固有でパーソナライズされたプレイリストを生成し、大規模なデプロイに成功した。
論文 参考訳(メタデータ) (2025-01-10T11:46:51Z) - Classifier-Guided Captioning Across Modalities [69.75111271002137]
本稿では,音声キャプションにおける可聴性の獲得など,代替設定のセマンティクスにキャプションネットワークを適用する手法を提案する。
本フレームワークは, (i) 言語モデル(LM)を組み込んだ冷凍キャプションシステムと, (ii) キャプションシステムを案内するテキスト分類器の2つの主要コンポーネントから構成される。
特に、既存のゼロショット音声キャプションシステムと組み合わせることで、その品質を改善し、ゼロショット音声キャプションにおける最先端の性能を設定する。
論文 参考訳(メタデータ) (2025-01-03T18:09:26Z) - Enhancing Sequential Music Recommendation with Personalized Popularity Awareness [56.972624411205224]
本稿では、パーソナライズされた人気情報をシーケンシャルなレコメンデーションに組み込む新しいアプローチを提案する。
実験結果から、パーソナライズされた最もポピュラーなレコメンデータは、既存の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-09-06T15:05:12Z) - LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation [49.89372182441713]
マルチモーダルコールドスタートプレイリスト継続モデルであるLARPを導入する。
我々のフレームワークはタスク固有の抽象化の段階を増大させており、イントラトラック(音声)コントラスト損失、トラックトラックコントラスト損失、トラックプレイリストコントラスト損失である。
論文 参考訳(メタデータ) (2024-06-20T14:02:15Z) - Talk the Walk: Synthetic Data Generation for Conversational Music
Recommendation [62.019437228000776]
本稿では,広く利用可能なアイテムコレクションにおいて,符号化された専門知識を活用することで,現実的な高品質な会話データを生成するTalkWalkを提案する。
人間の収集したデータセットで100万以上の多様な会話を生成します。
論文 参考訳(メタデータ) (2023-01-27T01:54:16Z) - Exploiting Device and Audio Data to Tag Music with User-Aware Listening
Contexts [8.224040855079176]
本研究では,ユーザを意識した楽曲自動タグを有効活用することにより,ユーザの状況に応じたプレイリストを一定時間で生成できるシステムを提案する。
実験により、このようなコンテキスト対応のパーソナライズされた楽曲検索システムは実現可能であるが、新規ユーザの場合は性能が低下することが示された。
論文 参考訳(メタデータ) (2022-11-14T10:08:12Z) - Quick Lists: Enriched Playlist Embeddings for Future Playlist
Recommendation [0.0]
本稿では,プレイリストの長さに不変で,局所的およびグローバルなトラック順序に敏感なプレイリスト埋め込みを生成する新しい方法を提案する。
埋め込みはまた、プレイリストシークエンシングに関する情報をキャプチャし、プレイリストユーザに関する情報を充実させる。
論文 参考訳(メタデータ) (2020-06-17T17:08:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。