論文の概要: Music Playlist Title Generation: A Machine-Translation Approach
- arxiv url: http://arxiv.org/abs/2110.07354v1
- Date: Sun, 3 Oct 2021 04:39:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-17 15:11:07.156020
- Title: Music Playlist Title Generation: A Machine-Translation Approach
- Title(参考訳): 音楽プレイリストのタイトル生成 : 機械翻訳アプローチ
- Authors: SeungHeon Doh, Junwon Lee, Juhan Nam
- Abstract要約: 楽曲の集合からプレイリストのタイトルを自動的に生成する機械翻訳手法を提案する。
我々は、トラックIDのシーケンスを入力として、プレイリストタイトル内の単語のシーケンスを出力として取ります。
プレイリスト中の楽曲の秩序な性質を考慮し、入力シーケンスの順序を除去する2つの手法を提案する。
- 参考スコア(独自算出の注目度): 6.7034293304862755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a machine-translation approach to automatically generate a
playlist title from a set of music tracks. We take a sequence of track IDs as
input and a sequence of words in a playlist title as output, adapting the
sequence-to-sequence framework based on Recurrent Neural Network (RNN) and
Transformer to the music data. Considering the orderless nature of music tracks
in a playlist, we propose two techniques that remove the order of the input
sequence. One is data augmentation by shuffling and the other is deleting the
positional encoding. We also reorganize the existing music playlist datasets to
generate phrase-level playlist titles. The result shows that the Transformer
models generally outperform the RNN model. Also, removing the order of input
sequence improves the performance further.
- Abstract(参考訳): 楽曲の集合からプレイリストのタイトルを自動的に生成する機械翻訳手法を提案する。
トラックIDのシーケンスを入力として、プレイリストタイトル内の単語列を出力として、リカレントニューラルネットワーク(RNN)とトランスフォーマーに基づくシーケンス・ツー・シーケンス・フレームワークを音楽データに適用する。
プレイリスト中の楽曲の秩序な性質を考慮し、入力シーケンスの順序を除去する2つの手法を提案する。
1つはシャッフルによるデータ拡張であり、もう1つは位置エンコーディングを削除している。
また、既存のプレイリストデータセットを再編成し、フレーズレベルのプレイリストのタイトルを生成する。
その結果、Transformerモデルは一般的にRNNモデルよりも優れていた。
また、入力シーケンスの順序の削除により、さらに性能が向上する。
関連論文リスト
- N-Gram Unsupervised Compoundation and Feature Injection for Better
Symbolic Music Understanding [27.554853901252084]
音楽系列は隣接要素間の強い相関関係を示し、自然言語処理(NLP)によるN-gram技術の主要な候補となる。
本稿では,N-gramアプローチを利用したシンボリック・ミュージック・シーケンス理解のための新しい手法NG-Midiformerを提案する。
論文 参考訳(メタデータ) (2023-12-13T06:08:37Z) - Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。
以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文 参考訳(メタデータ) (2023-06-08T15:31:05Z) - SeqTrack: Sequence to Sequence Learning for Visual Object Tracking [79.90729193686835]
視覚追跡のためのシーケンシャル・ツー・シーケンス学習フレームワークSeqTrackを提案する。
視覚的トラッキングをシーケンス生成問題とみなし、自動回帰的にオブジェクト境界ボックスを予測する。
論文 参考訳(メタデータ) (2023-04-27T17:56:29Z) - Music Playlist Title Generation Using Artist Information [4.201869316472344]
本稿では,一連の楽曲からプレイリストのタイトルを生成するエンコーダ・デコーダモデルを提案する。
トラックIDとアーティストIDを入力シーケンスとして比較した結果, 単語重複, 意味的関連性, 多様性の観点から, アーティストベースアプローチが性能を著しく向上させることが明らかとなった。
論文 参考訳(メタデータ) (2023-01-14T00:19:39Z) - Machine Composition of Korean Music via Topological Data Analysis and
Artificial Neural Network [6.10183951877597]
楽曲を直接供給するのではなく、所定の音楽データに埋め込まれた作曲原理を機械に教える機械合成法を提案する。
ColorblackOverlap行列は、新しい楽曲をアルゴリズムで合成し、目的の人工ニューラルネットワークに向けてシード音楽を提供する。
論文 参考訳(メタデータ) (2022-03-29T12:11:31Z) - Discovering Non-monotonic Autoregressive Orderings with Variational
Inference [67.27561153666211]
我々は、訓練データから高品質な生成順序を純粋に検出する、教師なし並列化可能な学習装置を開発した。
エンコーダを非因果的注意を持つトランスフォーマーとして実装し、1つのフォワードパスで置換を出力する。
言語モデリングタスクにおける経験的結果から,我々の手法は文脈認識であり,一定の順序と競合する,あるいはより優れた順序を見つけることができる。
論文 参考訳(メタデータ) (2021-10-27T16:08:09Z) - Augmenting Sequential Recommendation with Pseudo-Prior Items via
Reversely Pre-training Transformer [61.818320703583126]
逐次レコメンデーションはアイテムシーケンスを時系列的にモデル化することで進化するパターンを特徴付ける。
最近のトランスフォーマの開発はコミュニティに効果的なシーケンスエンコーダの設計を促している。
textbfseudo-prior items(asrep)を用いたtextbfsequential textbfrecommendationのためのtextbfaugmentingの新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-02T18:06:23Z) - Melon Playlist Dataset: a public dataset for audio-based playlist
generation and music tagging [8.658926288789164]
我々は649,091トラックと148,826の関連するプレイリストに対して,30,652の異なるタグで注釈付けされたメル-スペクトログラムの公開データセットを提示する。
データはすべて、人気の高い韓国のストリーミングサービスMelonから集められている。
このデータセットは、音楽情報検索タスク、特に自動タグ付けと自動プレイリスト継続に適している。
論文 参考訳(メタデータ) (2021-01-30T10:13:10Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z) - Quick Lists: Enriched Playlist Embeddings for Future Playlist
Recommendation [0.0]
本稿では,プレイリストの長さに不変で,局所的およびグローバルなトラック順序に敏感なプレイリスト埋め込みを生成する新しい方法を提案する。
埋め込みはまた、プレイリストシークエンシングに関する情報をキャプチャし、プレイリストユーザに関する情報を充実させる。
論文 参考訳(メタデータ) (2020-06-17T17:08:52Z) - Sparse Sinkhorn Attention [93.88158993722716]
Sparse Sinkhorn Attentionを提案する。
本稿では,列上の潜在置換を生成するメタソートネットワークを提案する。
ソートシーケンスが与えられた場合、局所ウィンドウのみを用いて準グロバルアテンションを計算することができる。
論文 参考訳(メタデータ) (2020-02-26T04:18:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。