論文の概要: ByteCover: Cover Song Identification via Multi-Loss Training
- arxiv url: http://arxiv.org/abs/2010.14022v2
- Date: Fri, 23 Apr 2021 06:30:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 13:18:00.341791
- Title: ByteCover: Cover Song Identification via Multi-Loss Training
- Title(参考訳): bytecover: マルチロストレーニングによるカバーソングの識別
- Authors: Xingjian Du, Zhesong Yu, Bilei Zhu, Xiaoou Chen, Zejun Ma
- Abstract要約: ByteCoverはカバーソング識別(CSI)のための新しい特徴学習法である
2つの大きな改善は、CSIのモデルの性能をさらに向上させるように設計されている。
複数のデータセット上でByteCoverの有効性と効率を実証した。
- 参考スコア(独自算出の注目度): 20.215501383270706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present in this paper ByteCover, which is a new feature learning method
for cover song identification (CSI). ByteCover is built based on the classical
ResNet model, and two major improvements are designed to further enhance the
capability of the model for CSI. In the first improvement, we introduce the
integration of instance normalization (IN) and batch normalization (BN) to
build IBN blocks, which are major components of our ResNet-IBN model. With the
help of the IBN blocks, our CSI model can learn features that are invariant to
the changes of musical attributes such as key, tempo, timbre and genre, while
preserving the version information. In the second improvement, we employ the
BNNeck method to allow a multi-loss training and encourage our method to
jointly optimize a classification loss and a triplet loss, and by this means,
the inter-class discrimination and intra-class compactness of cover songs, can
be ensured at the same time. A set of experiments demonstrated the
effectiveness and efficiency of ByteCover on multiple datasets, and in the
Da-TACOS dataset, ByteCover outperformed the best competitive system by 20.9\%.
- Abstract(参考訳): 本稿では,カバーソング識別(csi)のための新しい特徴学習手法bytecoverを提案する。
ByteCoverは古典的なResNetモデルに基づいて構築されており、CSIのモデルの性能をさらに向上するために2つの大きな改善がなされている。
最初の改良では、ResNet-IBNモデルの主要なコンポーネントであるIBNブロックを構築するために、インスタンス正規化(IN)とバッチ正規化(BN)を統合します。
IBNブロックの助けを借りて、我々のCSIモデルは、バージョン情報を保持しながら、キー、テンポ、音色、ジャンルなどの音楽属性の変化に不変な特徴を学習することができる。
第2の改善としてbnneck法を採用し,マルチロストレーニングを可能にし,分類損失と三重項損失を共同で最適化し,カバーソングのクラス間識別とクラス内コンパクト性を同時に確保する。
複数のデータセット上でByteCoverの有効性と効率を実証した一連の実験で、Da-TACOSデータセットでは、ByteCoverは最高の競争システムを20.9\%上回った。
関連論文リスト
- BDC-Occ: Binarized Deep Convolution Unit For Binarized Occupancy Network [55.21288428359509]
既存の3D占有ネットワークは重要なハードウェアリソースを必要としており、エッジデバイスの配備を妨げている。
本稿では,バイナライズド・ディープ・コンボリューション(BDC)ユニットを提案し,バイナライズド・ディープ・コンボリューション・レイヤの数を増やしつつ性能を効果的に向上させる。
我々のBDC-Occモデルは既存の3D占有ネットワークをバイナライズするために提案したBDCユニットを適用して作成する。
論文 参考訳(メタデータ) (2024-05-27T10:44:05Z) - A New Learning Paradigm for Foundation Model-based Remote Sensing Change
Detection [54.01158175996638]
変化検出(CD)は、土地被覆の動的過程を観察し解析するための重要な課題である。
本稿では,基盤モデルに基づくCD適応フレームワークであるBi-Temporal Adapter Network (BAN)を提案する。
論文 参考訳(メタデータ) (2023-12-02T15:57:17Z) - Unified Batch Normalization: Identifying and Alleviating the Feature
Condensation in Batch Normalization and a Unified Framework [55.22949690864962]
バッチ正規化(BN)は、現代のニューラルネットワーク設計において欠かせない技術となっている。
UBN(Unified Batch Normalization)と呼ばれる2段階統合フレームワークを提案する。
UBNは異なる視覚バックボーンと異なる視覚タスクのパフォーマンスを大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-27T16:41:31Z) - CoverHunter: Cover Song Identification with Refined Attention and
Alignments [19.173689175634106]
カバーソング識別(CSI)は、クエリトラックが与えられたアンカーの異なるバージョンで同じ音楽を見つけることに焦点を当てている。
本研究では,既存の検出方式の欠点を克服するCoverHunterという新しいシステムを提案する。
論文 参考訳(メタデータ) (2023-06-15T10:34:20Z) - Bi-directional Feature Reconstruction Network for Fine-Grained Few-Shot
Image Classification [61.411869453639845]
クラス間およびクラス内変動を同時に対応できるバイコンストラクション機構を導入する。
この設計は、モデルがより微妙で差別的な特徴を探索するのに役立つ。
広範に使用されている3つのきめ細かな画像分類データセットに対する実験結果は、一貫して大幅に改善されている。
論文 参考訳(メタデータ) (2022-11-30T16:55:14Z) - Content-aware Scalable Deep Compressed Sensing [8.865549833627794]
本稿では、画像圧縮センシング問題に対処するため、CASNetと呼ばれる新しいコンテンツ対応スケーラブルネットワークを提案する。
まず,各画像領域の重要度を評価するためにデータ駆動型サリエンシ検出器を採用し,サンプリングレートアロケーションのためのサリエンシベースのブロック比アグリゲーション(BRA)戦略を提案する。
トレーニングの収束を加速し、ネットワークの堅牢性を向上させるために、SVDベースのスキームとランダム変換強化(RTE)戦略を提案する。
論文 参考訳(メタデータ) (2022-07-19T14:59:14Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - AutoBERT-Zero: Evolving BERT Backbone from Scratch [94.89102524181986]
そこで本稿では,提案するハイブリッドバックボーンアーキテクチャを自動検索するOP-NASアルゴリズムを提案する。
提案するOP-NASの効率を向上させるために,探索アルゴリズムと候補モデルの評価を最適化する。
実験の結果、検索されたアーキテクチャ(AutoBERT-Zero)は、様々な下流タスクにおいてBERTとそのバリエーションの異なるモデル容量を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-07-15T16:46:01Z) - Generalized Reinforcement Meta Learning for Few-Shot Optimization [3.7675996866306845]
本稿では, 汎用的かつ柔軟な強化学習(RL)に基づくメタラーニングフレームワークを提案する。
我々のフレームワークは簡単にネットワークアーキテクチャ検索に拡張できる。
論文 参考訳(メタデータ) (2020-05-04T03:21:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。