論文の概要: Unsupervised Lead Sheet Generation via Semantic Compression
- arxiv url: http://arxiv.org/abs/2310.10772v1
- Date: Mon, 16 Oct 2023 19:12:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 19:19:30.434486
- Title: Unsupervised Lead Sheet Generation via Semantic Compression
- Title(参考訳): セマンティック圧縮による非教師なし鉛板生成
- Authors: Zachary Novack, Nikita Srivatsan, Taylor Berg-Kirkpatrick, Julian
McAuley
- Abstract要約: 我々は、リードシートを元のシーケンスの離散サブセレクションとしてモデル化する、リード-AEと呼ばれる新しいモデルを導入する。
提案手法は,確立された決定論的ベースラインを改良し,大規模マルチトラックスコアのコヒーレントな削減を実現する。
- 参考スコア(独自算出の注目度): 47.79518084062721
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lead sheets have become commonplace in generative music research, being used
as an initial compressed representation for downstream tasks like multitrack
music generation and automatic arrangement. Despite this, researchers have
often fallen back on deterministic reduction methods (such as the skyline
algorithm) to generate lead sheets when seeking paired lead sheets and full
scores, with little attention being paid toward the quality of the lead sheets
themselves and how they accurately reflect their orchestrated counterparts. To
address these issues, we propose the problem of conditional lead sheet
generation (i.e. generating a lead sheet given its full score version), and
show that this task can be formulated as an unsupervised music compression
task, where the lead sheet represents a compressed latent version of the score.
We introduce a novel model, called Lead-AE, that models the lead sheets as a
discrete subselection of the original sequence, using a differentiable top-k
operator to allow for controllable local sparsity constraints. Across both
automatic proxy tasks and direct human evaluations, we find that our method
improves upon the established deterministic baseline and produces coherent
reductions of large multitrack scores.
- Abstract(参考訳): リードシートは生成的音楽研究において一般的となり、マルチトラック音楽の生成や自動アレンジなどの下流タスクの初期圧縮表現として使われている。
それにもかかわらず、研究者は、ペアのリードシートとフルスコアを求めるときにリードシートを生成する決定論的縮小法(スカイラインアルゴリズムなど)をしばしば廃止し、リードシート自体の品質と、それらをいかに正確に反映するかにはほとんど注意が払われていない。
これらの問題に対処するために、条件付きリードシート生成の問題(すなわち、フルスコアバージョンが与えられたリードシートを生成する)を提案し、このタスクを教師なしの音楽圧縮タスクとして定式化できることを示し、リードシートがスコアの圧縮潜在バージョンを表す。
そこで本研究では,リードシートを元の配列の離散的な部分選択としてモデル化し,局所的スパーシティ制約を制御可能なtop-k演算子を用いた新しいモデルであるleading-aeを提案する。
自動プロキシタスクと直接人間評価の両方において,本手法は確立された決定論的ベースラインを改善し,大規模マルチトラックスコアのコヒーレントな削減を実現する。
関連論文リスト
- Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - WeCheck: Strong Factual Consistency Checker via Weakly Supervised
Learning [40.5830891229718]
本稿では,複数のリソースを集約して,正確かつ効率的な実測値(WeCheck)をトレーニングする,弱教師付きフレームワークを提案する。
様々なタスクに関する総合的な実験は、平均してTRUEベンチマークにおける従来の最先端手法よりも3.4%の絶対的な改善を実現するWeCheckの強い性能を示す。
論文 参考訳(メタデータ) (2022-12-20T08:04:36Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Self-Conditioned Generative Adversarial Networks for Image Editing [61.50205580051405]
Generative Adversarial Networks (GAN) はバイアスの影響を受けやすい。
我々は、このバイアスが公平性だけでなく、分布のコアから逸脱する際の潜在トラバース編集手法の崩壊に重要な役割を果たしていると論じる。
論文 参考訳(メタデータ) (2022-02-08T18:08:24Z) - Creating Training Sets via Weak Indirect Supervision [66.77795318313372]
Weak Supervision (WS)フレームワークは、複数の潜在的にノイズの多い監督ソースからトレーニングラベルを合成する。
Weak Indirect Supervision (WIS) は、トレーニングラベルの自動合成のための新しい研究課題である。
我々は,ユーザが提供するラベル関係を利用して間接的な監督源をモデル化し活用する確率論的モデリング手法PLRMを開発した。
論文 参考訳(メタデータ) (2021-10-07T14:09:35Z) - Generating Lead Sheets with Affect: A Novel Conditional seq2seq
Framework [3.029434408969759]
本稿では,リードシート内のコード進行の正負性や負性性を計算するための新しい手法を提案する。
私たちのアプローチは、シーケンス・トゥ・シークエンスアーキテクチャのエンコーダ部分に高レベルの条件を含むため、ニューラルネットワーク翻訳(NMT)問題に似ています。
提案された戦略は、制御可能な方法でリードシートを生成することができ、トレーニングデータセットのそれに似た音楽属性の分布をもたらす。
論文 参考訳(メタデータ) (2021-04-27T09:04:21Z) - Generating Music with a Self-Correcting Non-Chronological Autoregressive
Model [6.289267097017553]
本稿では,自己修正的,非時間的,自己回帰的モデルを用いた新しい音楽生成手法について述べる。
我々は音楽を編集イベントのシーケンスとして表現し、それぞれがノートの追加または削除を表す。
推論中、直接祖先サンプリングを用いて1回に1回の編集イベントを生成する。
論文 参考訳(メタデータ) (2020-08-18T20:36:47Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。