論文の概要: Embedding Calibration for Music Semantic Similarity using
Auto-regressive Transformer
- arxiv url: http://arxiv.org/abs/2103.07656v1
- Date: Sat, 13 Mar 2021 08:36:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 13:57:31.373138
- Title: Embedding Calibration for Music Semantic Similarity using
Auto-regressive Transformer
- Title(参考訳): オートレグレッシブトランスを用いた音楽セマンティック類似度の埋め込みキャリブレーション
- Authors: Xinran Zhang, Maosong Sun, Jiafeng Liu and Xiaobing Li
- Abstract要約: 本稿では,シンボリック音楽のための自動回帰型言語モデルにおける埋め込みキャリブレーションの異なる組み合わせを検討する。
その結果、音楽セマンティクスの類似性は自己回帰モデルの下で機能し、NLPのような低ベースラインの問題にも苦しむことが示された。
- 参考スコア(独自算出の注目度): 43.36560720793425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the advantages of using natural language processing (NLP) technology
for music is to fully exploit the embedding based representation learning
paradigm that can easily handle classical tasks such as semantic similarity.
However, recent researches have revealed the poor performance issue of common
baseline methods for semantic similarity in NLP. They show that some simple
embedding calibration methods can easily promote the performance of semantic
similarity without extra training hence is ready-to-use. Nevertheless, it is
still unclear which is the best combination of calibration methods and by how
much can we further improve the performance with such methods. Most
importantly, previous works are based on auto-encoder Transformer, hence the
performance under auto-regressive model for music is unclear. These render the
following open questions: does embedding based semantic similarity also apply
for auto-regressive music model, does poor baseline issue for semantic
similarity also exists, and if so, are there unexplored embedding calibration
methods to better promote the performance of music semantic similarity? In this
paper, we answer these questions by exploring different combination of
embedding calibration under auto-regressive language model for symbolic music.
Our results show that music semantic similarity works under auto-regressive
model, and also suffers from poor baseline issues like in NLP. Furthermore, we
provide optimal combination of embedding calibration that has not been explored
in previous researches. Results show that such combination of embedding
calibration can greatly improve music semantic similarity without further
training tasks.
- Abstract(参考訳): 音楽に自然言語処理(NLP)技術を使用する利点の1つは、意味的類似性のような古典的なタスクを容易に扱える埋め込みベースの表現学習パラダイムを十分に活用することである。
しかし,近年の研究では,NLPにおける意味的類似性に対する共通ベースライン手法の性能上の問題点が指摘されている。
これらの結果から, 簡易組込み校正法によっては, 追加の訓練を必要とせず, 意味的類似性の向上が容易であることがわかった。
それにもかかわらず、キャリブレーション方法の最良の組み合わせはどれか、そしてそのような方法でパフォーマンスをさらに改善できるかどうかはまだ不明です。
最も重要なのは、以前の作品は自動エンコーダトランスフォーマーに基づいているため、音楽の自動回帰モデルによるパフォーマンスは不明です。
埋め込みベースのセマンティクス類似性は自己回帰型音楽モデルにも当てはまるか、セマンティクス類似性に関するベースラインの問題が貧弱であるか、もしそうであれば、音楽セマンティクス類似性のパフォーマンスを促進するための未検討の埋め込みキャリブレーション方法があるか?
本稿では,シンボリック音楽における自動回帰型言語モデルにおける埋め込みキャリブレーションの異なる組み合わせについて検討する。
その結果,音楽の意味的類似性は自己回帰モデルの下で機能し,NLPのような低ベースライン問題にも苦しむことが示された。
さらに,これまでの研究で検討されていない埋込校正の最適組み合わせを提案する。
その結果、埋め込みキャリブレーションの組み合わせは、さらなるトレーニングタスクなしで音楽意味の類似性を大幅に改善することができます。
関連論文リスト
- Match me if you can: Semi-Supervised Semantic Correspondence Learning with Unpaired Images [76.47980643420375]
本稿では,意味的対応の学習に固有のデータ・ハングリー・マターが存在するという仮説に基づく。
我々は,機械の監督を通じて,ペア化されたキーポイントを確実に強化する単純な機械注釈器を実証する。
我々のモデルは,SPair-71k,PF-PASCAL,PF-WILLOWといった意味対応学習ベンチマークの最先端モデルを上回る。
論文 参考訳(メタデータ) (2023-11-30T13:22:15Z) - Learning Context-aware Classifier for Semantic Segmentation [88.88198210948426]
本稿では,文脈認識型分類器の学習を通じて文脈ヒントを利用する。
本手法はモデルに依存しないため,ジェネリックセグメンテーションモデルにも容易に適用できる。
無視できる追加パラメータと+2%の推論時間だけで、小型モデルと大型モデルの両方で十分な性能向上が達成されている。
論文 参考訳(メタデータ) (2023-03-21T07:00:35Z) - Towards Context-Aware Neural Performance-Score Synchronisation [2.0305676256390934]
音楽の同期は、音楽の複数の表現を統一的にナビゲートする手段を提供する。
従来の同期手法は知識駆動と性能分析のアプローチを用いてアライメントを計算する。
このPhDは、データ駆動型コンテクスト対応アライメントアプローチの提案により、パフォーマンススコア同期の研究をさらに進める。
論文 参考訳(メタデータ) (2022-05-31T16:45:25Z) - SimMatch: Semi-supervised Learning with Similarity Matching [43.61802702362675]
SimMatchは、意味的類似性とインスタンス類似性を考慮した、新しい半教師付き学習フレームワークである。
400エポックのトレーニングで、SimMatchは67.2%、Top-1の正確度は74.4%で、ImageNetでは1%と10%のラベルが付けられている。
論文 参考訳(メタデータ) (2022-03-14T08:08:48Z) - Adversarial Training with Contrastive Learning in NLP [0.0]
本稿では,言語処理タスクを逆学習するために,比較学習(ATCL)を用いた逆学習を提案する。
中心となる考え方は、高速勾配法(FGM)によって入力の埋め込み空間に線形摂動を生じさせ、元の表現と摂動表現を対照的な学習によって密に保つようモデルを訓練することである。
この結果から, 定量的(複雑度, BLEU) のスコアは, ベースラインに比べて向上しただけでなく, 両タスクのセマンティックレベルにおいても, 質的な結果が得られた。
論文 参考訳(メタデータ) (2021-09-19T07:23:45Z) - Neural String Edit Distance [77.72325513792981]
文字列対分類とシーケンス生成のためのニューラルストリング編集距離モデルを提案する。
オリジナルの期待最大化学習編集距離アルゴリズムを微分可能な損失関数に変更します。
ひとつのフレームワークでパフォーマンスと解釈性をトレードオフできることを示します。
論文 参考訳(メタデータ) (2021-04-16T22:16:47Z) - Latte-Mix: Measuring Sentence Semantic Similarity with Latent
Categorical Mixtures [0.0]
既学習言語モデルに基づいて分類的変分オートエンコーダを学習する。
ラッテ・ミクスによりこれらの微調整モデルをさらに改善できることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-21T23:45:18Z) - Audio Impairment Recognition Using a Correlation-Based Feature
Representation [85.08880949780894]
本稿では,特徴対の相関に基づく手作り特徴の新しい表現を提案する。
実験段階において,コンパクトな特徴次元と計算速度の向上の観点から,優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-22T13:34:37Z) - RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement
Learning [69.20460466735852]
本稿では,オンライン伴奏生成のための深層強化学習アルゴリズムを提案する。
提案アルゴリズムは人体に応答し,メロディック,ハーモニック,多種多様な機械部品を生成する。
論文 参考訳(メタデータ) (2020-02-08T03:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。