論文の概要: Music Playlist Title Generation: A Machine-Translation Approach
- arxiv url: http://arxiv.org/abs/2110.07354v1
- Date: Sun, 3 Oct 2021 04:39:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-17 15:11:07.156020
- Title: Music Playlist Title Generation: A Machine-Translation Approach
- Title(参考訳): 音楽プレイリストのタイトル生成 : 機械翻訳アプローチ
- Authors: SeungHeon Doh, Junwon Lee, Juhan Nam
- Abstract要約: 楽曲の集合からプレイリストのタイトルを自動的に生成する機械翻訳手法を提案する。
我々は、トラックIDのシーケンスを入力として、プレイリストタイトル内の単語のシーケンスを出力として取ります。
プレイリスト中の楽曲の秩序な性質を考慮し、入力シーケンスの順序を除去する2つの手法を提案する。
- 参考スコア(独自算出の注目度): 6.7034293304862755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a machine-translation approach to automatically generate a
playlist title from a set of music tracks. We take a sequence of track IDs as
input and a sequence of words in a playlist title as output, adapting the
sequence-to-sequence framework based on Recurrent Neural Network (RNN) and
Transformer to the music data. Considering the orderless nature of music tracks
in a playlist, we propose two techniques that remove the order of the input
sequence. One is data augmentation by shuffling and the other is deleting the
positional encoding. We also reorganize the existing music playlist datasets to
generate phrase-level playlist titles. The result shows that the Transformer
models generally outperform the RNN model. Also, removing the order of input
sequence improves the performance further.
- Abstract(参考訳): 楽曲の集合からプレイリストのタイトルを自動的に生成する機械翻訳手法を提案する。
トラックIDのシーケンスを入力として、プレイリストタイトル内の単語列を出力として、リカレントニューラルネットワーク(RNN)とトランスフォーマーに基づくシーケンス・ツー・シーケンス・フレームワークを音楽データに適用する。
プレイリスト中の楽曲の秩序な性質を考慮し、入力シーケンスの順序を除去する2つの手法を提案する。
1つはシャッフルによるデータ拡張であり、もう1つは位置エンコーディングを削除している。
また、既存のプレイリストデータセットを再編成し、フレーズレベルのプレイリストのタイトルを生成する。
その結果、Transformerモデルは一般的にRNNモデルよりも優れていた。
また、入力シーケンスの順序の削除により、さらに性能が向上する。
関連論文リスト
- End-to-end Piano Performance-MIDI to Score Conversion with Transformers [26.900974153235456]
実世界のピアノ演奏-MIDIファイルから直接詳細な楽譜を構築するエンド・ツー・エンドのディープ・ラーニング・アプローチを提案する。
シンボリック・ミュージック・データのための新しいトークン化表現を備えたモダン・トランスフォーマー・ベース・アーキテクチャを提案する。
また,本手法は,演奏データからトリルマークやステム方向などの表記法の詳細を直接予測する最初の方法でもある。
論文 参考訳(メタデータ) (2024-09-30T20:11:37Z) - LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation [49.89372182441713]
マルチモーダルコールドスタートプレイリスト継続モデルであるLARPを導入する。
我々のフレームワークはタスク固有の抽象化の段階を増大させており、イントラトラック(音声)コントラスト損失、トラックトラックコントラスト損失、トラックプレイリストコントラスト損失である。
論文 参考訳(メタデータ) (2024-06-20T14:02:15Z) - N-Gram Unsupervised Compoundation and Feature Injection for Better
Symbolic Music Understanding [27.554853901252084]
音楽系列は隣接要素間の強い相関関係を示し、自然言語処理(NLP)によるN-gram技術の主要な候補となる。
本稿では,N-gramアプローチを利用したシンボリック・ミュージック・シーケンス理解のための新しい手法NG-Midiformerを提案する。
論文 参考訳(メタデータ) (2023-12-13T06:08:37Z) - Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。
以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文 参考訳(メタデータ) (2023-06-08T15:31:05Z) - Unified Sequence-to-Sequence Learning for Single- and Multi-Modal Visual Object Tracking [64.28025685503376]
SeqTrackは、ビジュアルトラッキングをシーケンス生成タスクとしてキャストし、オブジェクト境界ボックスを自動回帰的に予測する。
SeqTrackv2は補助モダリティのための統一インターフェースとタスクを指定するためのタスクプロンプトトークンのセットを統合している。
このシーケンス学習パラダイムは、トラッキングフレームワークを単純化するだけでなく、14の挑戦的なベンチマークで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-04-27T17:56:29Z) - Music Playlist Title Generation Using Artist Information [4.201869316472344]
本稿では,一連の楽曲からプレイリストのタイトルを生成するエンコーダ・デコーダモデルを提案する。
トラックIDとアーティストIDを入力シーケンスとして比較した結果, 単語重複, 意味的関連性, 多様性の観点から, アーティストベースアプローチが性能を著しく向上させることが明らかとなった。
論文 参考訳(メタデータ) (2023-01-14T00:19:39Z) - Discovering Non-monotonic Autoregressive Orderings with Variational
Inference [67.27561153666211]
我々は、訓練データから高品質な生成順序を純粋に検出する、教師なし並列化可能な学習装置を開発した。
エンコーダを非因果的注意を持つトランスフォーマーとして実装し、1つのフォワードパスで置換を出力する。
言語モデリングタスクにおける経験的結果から,我々の手法は文脈認識であり,一定の順序と競合する,あるいはより優れた順序を見つけることができる。
論文 参考訳(メタデータ) (2021-10-27T16:08:09Z) - Melon Playlist Dataset: a public dataset for audio-based playlist
generation and music tagging [8.658926288789164]
我々は649,091トラックと148,826の関連するプレイリストに対して,30,652の異なるタグで注釈付けされたメル-スペクトログラムの公開データセットを提示する。
データはすべて、人気の高い韓国のストリーミングサービスMelonから集められている。
このデータセットは、音楽情報検索タスク、特に自動タグ付けと自動プレイリスト継続に適している。
論文 参考訳(メタデータ) (2021-01-30T10:13:10Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z) - Sparse Sinkhorn Attention [93.88158993722716]
Sparse Sinkhorn Attentionを提案する。
本稿では,列上の潜在置換を生成するメタソートネットワークを提案する。
ソートシーケンスが与えられた場合、局所ウィンドウのみを用いて準グロバルアテンションを計算することができる。
論文 参考訳(メタデータ) (2020-02-26T04:18:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。