論文の概要: Artist Similarity with Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2107.14541v1
- Date: Fri, 30 Jul 2021 10:44:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-02 12:51:01.476401
- Title: Artist Similarity with Graph Neural Networks
- Title(参考訳): グラフニューラルネットワークとアーティストの類似性
- Authors: Filip Korzeniowski, Sergio Oramas, Fabien Gouyon
- Abstract要約: 本稿では,三重項損失を学習したグラフニューラルネットワークを用いて,アーティスト間の類似性を計算するためのハイブリッドアプローチを提案する。
グラフニューラルネットワークアーキテクチャの新規性は、アーティスト接続のグラフのトポロジとコンテンツ機能を組み合わせて、アーティストを類似性を符号化したベクトル空間に埋め込むことである。
17,673人のアーティストを擁するこのデータセットは、これまでで最大の学術的アーティスト類似性データセットであり、コンテンツベースの機能を含んでいる。
- 参考スコア(独自算出の注目度): 1.160208922584163
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artist similarity plays an important role in organizing, understanding, and
subsequently, facilitating discovery in large collections of music. In this
paper, we present a hybrid approach to computing similarity between artists
using graph neural networks trained with triplet loss. The novelty of using a
graph neural network architecture is to combine the topology of a graph of
artist connections with content features to embed artists into a vector space
that encodes similarity. To evaluate the proposed method, we compile the new
OLGA dataset, which contains artist similarities from AllMusic, together with
content features from AcousticBrainz. With 17,673 artists, this is the largest
academic artist similarity dataset that includes content-based features to
date. Moreover, we also showcase the scalability of our approach by
experimenting with a much larger proprietary dataset. Results show the
superiority of the proposed approach over current state-of-the-art methods for
music similarity. Finally, we hope that the OLGA dataset will facilitate
research on data-driven models for artist similarity.
- Abstract(参考訳): アーティストの類似性は、大規模な音楽コレクションの発見の組織化、理解、そしてその後の促進に重要な役割を果たしている。
本稿では,三重項損失を学習したグラフニューラルネットワークを用いてアーティスト間の類似性を計算するためのハイブリッドアプローチを提案する。
グラフニューラルネットワークアーキテクチャを使う斬新な方法は、アーティスト接続のグラフのトポロジーとコンテンツの特徴を組み合わせることで、アーティストを類似性をエンコードするベクトル空間に埋め込むことである。
提案手法を評価するために,AllMusicのアーティスト類似性を含む新たなOLGAデータセットとAtlassianBrainzのコンテンツ特徴をコンパイルする。
17,673人のアーティストを抱えるこのデータセットは、これまでで最大の学術的アーティストの類似性データセットだ。
さらに、より大規模なプロプライエタリなデータセットを実験することで、このアプローチのスケーラビリティを示す。
その結果,音楽の類似性に対する現在の最先端手法よりも,提案手法の優位性を示す。
最後に、OLGAデータセットがアーティストの類似性に関するデータ駆動モデルの研究を促進することを期待する。
関連論文リスト
- MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models [57.47799823804519]
私たちは、ミュージシャンが映画の脚本だけでなく、視覚化を通して音楽を作る方法にインスピレーションを受けています。
本稿では,テキスト記述と対応する画像からの手がかりを効果的に利用して音楽を合成するモデルであるMeLFusionを提案する。
音楽合成パイプラインに視覚情報を加えることで、生成した音楽の質が大幅に向上することを示す。
論文 参考訳(メタデータ) (2024-06-07T06:38:59Z) - Learning Multimodal Volumetric Features for Large-Scale Neuron Tracing [72.45257414889478]
オーバーセグメントニューロン間の接続を予測し,人間の作業量を削減することを目的としている。
最初はFlyTracingという名前のデータセットを構築しました。
本稿では,高密度なボリュームEM画像の埋め込みを生成するための,新しい接続性を考慮したコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-05T19:45:12Z) - Combinatorial music generation model with song structure graph analysis [18.71152526968065]
音符列や楽器などの情報をノードの特徴として用いたグラフを構築し,音符列間の相関がエッジの特徴として機能する。
グラフニューラルネットワークを用いてノード表現を訓練し,ノード表現をUnetの入力として使用して,ConLONのピアノロール画像遅延を生成する。
論文 参考訳(メタデータ) (2023-12-24T04:09:30Z) - Representing Videos as Discriminative Sub-graphs for Action Recognition [165.54738402505194]
ビデオ中の各アクションの識別パターンを表現およびエンコードするためのサブグラフの新たな設計を提案する。
時空グラフとクラスタを各スケールでコンパクトなサブグラフに新たに構築するMUlti-scale Sub-Earn Ling (MUSLE) フレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-11T16:15:25Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Cold Start Similar Artists Ranking with Gravity-Inspired Graph
Autoencoders [18.395568778680207]
我々は、有向グラフと属性グラフのリンク予測タスクとして、コールドスタート類似アーティストランキング問題をモデル化する。
次に、グラフオートエンコーダアーキテクチャを利用して、このグラフからノード埋め込み表現を学習し、新しいアーティストの最もよく似た隣人を自動的にランク付けする。
実世界のコールドスタートに似たアーティストが、グローバル音楽ストリーミングサービスのランキング問題に対処することで、我々のフレームワークの柔軟性と効果を実証的に示す。
論文 参考訳(メタデータ) (2021-08-02T17:19:47Z) - Graph Neural Networks for Knowledge Enhanced Visual Representation of
Paintings [14.89186519385364]
ArtSAGENetは、グラフニューラルネットワーク(GNN)と畳み込みニューラルネットワーク(CNN)を統合する新しいアーキテクチャである。
提案したArtSAGENetは,アーティストとアートワーク間の重要な依存関係をキャプチャし,エンコードする。
本研究は美術品の分析とキュレーションにビジュアルコンテンツとセマンティクスを統合する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2021-05-17T23:05:36Z) - Exploiting Heterogeneous Graph Neural Networks with Latent Worker/Task
Correlation Information for Label Aggregation in Crowdsourcing [72.34616482076572]
クラウドソーシングは専門家ではなく、専門家でない労働者からラベルを集めるのに便利であることから、多くの注目を集めている。
群集ラベルを集約するグラフニューラルネットワークに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:12:37Z) - Detecting Generic Music Features with Single Layer Feedforward Network
using Unsupervised Hebbian Computation [3.8707695363745223]
著者らは、人気のあるオープンソース音楽コーパスから、そのような特徴に関する情報を抽出する。
彼らは同じデータセットを使用して、一層ニューラルネットワークに教師なしのヘビアン学習技術を適用する。
教師なしトレーニングアルゴリズムは、提案したニューラルネットワークを強化し、音楽特徴の検出を成功させるために90.36%の精度を達成する。
論文 参考訳(メタデータ) (2020-08-31T13:57:31Z) - Content-based Music Similarity with Triplet Networks [21.220806977978853]
本稿では,コンテンツに基づく音楽の類似性に基づいた3重項ニューラルネットワークによる楽曲の埋め込みの実現可能性について検討する。
我々のネットワークは、同じアーティストの2曲が別のアーティストの3曲よりも互いに近くに埋め込まれるように、三重奏曲を用いて訓練されている。
論文 参考訳(メタデータ) (2020-08-11T18:10:02Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。