論文の概要: Learning to rank music tracks using triplet loss
- arxiv url: http://arxiv.org/abs/2005.12977v1
- Date: Mon, 18 May 2020 08:20:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 00:42:30.703476
- Title: Learning to rank music tracks using triplet loss
- Title(参考訳): 三重項損失を用いた楽曲のランク付け学習
- Authors: Laure Pr\'etet, Ga\"el Richard, Geoffroy Peeters
- Abstract要約: 楽曲を明示的にタグ付けすることなく、音声コンテンツに基づいて直接レコメンデーションを行う手法を提案する。
畳み込みニューラルネットワークを訓練し、三重項損失による類似性を学習する。
結果は、特に自動プール層に関連付けられた場合、システムの効率性を強調します。
- 参考スコア(独自算出の注目度): 6.43271391521664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most music streaming services rely on automatic recommendation algorithms to
exploit their large music catalogs. These algorithms aim at retrieving a ranked
list of music tracks based on their similarity with a target music track. In
this work, we propose a method for direct recommendation based on the audio
content without explicitly tagging the music tracks. To that aim, we propose
several strategies to perform triplet mining from ranked lists. We train a
Convolutional Neural Network to learn the similarity via triplet loss. These
different strategies are compared and validated on a large-scale experiment
against an auto-tagging based approach. The results obtained highlight the
efficiency of our system, especially when associated with an Auto-pooling
layer.
- Abstract(参考訳): ほとんどの音楽ストリーミングサービスは、大規模な音楽カタログを利用するために自動レコメンデーションアルゴリズムに依存している。
これらのアルゴリズムは、ターゲット曲との類似性に基づいて、音楽トラックのランク付けリストを取得することを目的としている。
本研究では,楽曲に明示的にタグを付けることなく,音声コンテンツに基づいて直接推薦する手法を提案する。
そこで本研究では,ランクリストからトリプルトマイニングを行ういくつかの戦略を提案する。
畳み込みニューラルネットワークを訓練し、三重項損失による類似性を学習する。
これらの異なる戦略を比較し、自動タグベースのアプローチに対する大規模な実験で検証する。
その結果,特にオートプール層に関連した場合,システムの効率性が注目された。
関連論文リスト
- LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation [49.89372182441713]
マルチモーダルコールドスタートプレイリスト継続モデルであるLARPを導入する。
我々のフレームワークはタスク固有の抽象化の段階を増大させており、イントラトラック(音声)コントラスト損失、トラックトラックコントラスト損失、トラックプレイリストコントラスト損失である。
論文 参考訳(メタデータ) (2024-06-20T14:02:15Z) - Enhancing Music Genre Classification through Multi-Algorithm Analysis and User-Friendly Visualization [0.0]
本研究の目的は,異なる種類の音楽の認識方法をアルゴリズムに教えることである。
アルゴリズムはこれまでこれらの歌を聴いていないので、それぞれの歌をユニークにする方法を理解する必要があります。
論文 参考訳(メタデータ) (2024-05-27T17:57:20Z) - DeepSRGM -- Sequence Classification and Ranking in Indian Classical
Music with Deep Learning [7.140656816182373]
ラガは作曲と即興のメロディックな枠組みである。
インド古典音楽において,ラーガ認識は重要な音楽情報検索課題である。
本稿では,ラーガ認識に対する深層学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-15T18:11:02Z) - DITTO: Diffusion Inference-Time T-Optimization for Music Generation [49.90109850026932]
Diffusion Inference-Time T-Optimization (DITTO) は、事前訓練されたテキストから音楽への拡散モデルを推論時に制御するためのフレームワークである。
我々は、インペイント、アウトペイント、ループ化、強度、メロディ、音楽構造制御など、驚くほど幅広い音楽生成応用を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:10:10Z) - Self-Supervised Contrastive Learning for Robust Audio-Sheet Music
Retrieval Systems [3.997809845676912]
自己指導型コントラスト学習は、実際の音楽コンテンツからの注釈付きデータの不足を軽減することができることを示す。
クロスモーダルなピース識別の高レベルなタスクにスニペットを埋め込む。
本研究では,実際の音楽データが存在する場合,検索品質が30%から100%に向上することが観察された。
論文 参考訳(メタデータ) (2023-09-21T14:54:48Z) - Fairness Through Domain Awareness: Mitigating Popularity Bias For Music
Discovery [56.77435520571752]
音楽発見と人気バイアスの本質的な関係について検討する。
本稿では,グラフニューラルネットワーク(GNN)に基づくレコメンデータシステムにおいて,人気バイアスに対処する,ドメイン対応の個別フェアネスに基づくアプローチを提案する。
我々のアプローチでは、個々の公正さを用いて、真実を聴く経験、すなわち2つの歌が似ているとすると、この類似性は彼らの表現に反映されるべきである。
論文 参考訳(メタデータ) (2023-08-28T14:12:25Z) - Video-to-Music Recommendation using Temporal Alignment of Segments [5.7235653928654235]
ビデオのサウンドトラックとして使用される楽曲のモーダルな推薦について検討する。
音楽と映像の関連性を学習する自己教師システムを構築した。
本稿では,構造認識レコメンデーションを用いたシステムの性能向上のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-12T15:40:31Z) - GETMusic: Generating Any Music Tracks with a Unified Representation and
Diffusion Framework [58.64512825534638]
シンボリック・ミュージック・ジェネレーションは、ユーザーが音楽を作るのに役立つ音符を作成することを目的としている。
私たちは「GETMusic」と呼ばれるフレームワークを紹介します。「GET'」は「GEnerate Music Tracks」の略です。
GETScoreは、音符をトークンとして表現し、2D構造でトークンを整理する。
提案する表現は,非自己回帰生成モデルと組み合わせて,任意のソース・ターゲットトラックの組み合わせでGETMusicに音楽を生成する。
論文 参考訳(メタデータ) (2023-05-18T09:53:23Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - Detecting Generic Music Features with Single Layer Feedforward Network
using Unsupervised Hebbian Computation [3.8707695363745223]
著者らは、人気のあるオープンソース音楽コーパスから、そのような特徴に関する情報を抽出する。
彼らは同じデータセットを使用して、一層ニューラルネットワークに教師なしのヘビアン学習技術を適用する。
教師なしトレーニングアルゴリズムは、提案したニューラルネットワークを強化し、音楽特徴の検出を成功させるために90.36%の精度を達成する。
論文 参考訳(メタデータ) (2020-08-31T13:57:31Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。