論文の概要: Music Score Expansion with Variable-Length Infilling
- arxiv url: http://arxiv.org/abs/2111.06046v1
- Date: Thu, 11 Nov 2021 04:27:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-12 22:10:19.188924
- Title: Music Score Expansion with Variable-Length Infilling
- Title(参考訳): 可変長インフィルによる楽譜拡張
- Authors: Chih-Pin Tan, Chin-Jui Chang, Alvin W.Y. Su and Yi-Hsuan Yang
- Abstract要約: そこで本研究では,未完成セグメントを埋め込むために提案された可変長インフィル(VLI)モデルを用いて,既存の楽曲セグメントを楽曲境界で「延長」する手法について検討する。
ケーススタディでは、12バーから16バーに20の楽節を拡大し、拡張された結果においてVLIモデルが音楽境界を保存する程度について検討する。
- 参考スコア(独自算出の注目度): 27.7941666329557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we investigate using the variable-length infilling (VLI)
model, which is originally proposed to infill missing segments, to "prolong"
existing musical segments at musical boundaries. Specifically, as a case study,
we expand 20 musical segments from 12 bars to 16 bars, and examine the degree
to which the VLI model preserves musical boundaries in the expanded results
using a few objective metrics, including the Register Histogram Similarity we
newly propose. The results show that the VLI model has the potential to address
the expansion task.
- Abstract(参考訳): 本稿では,未完成セグメントを埋め込むためにもともと提案されていた可変長埋込モデルを用いて,音楽境界における既存のセグメントの「延長」について検討する。
具体的には,12バーから16バーに20の楽曲セグメントを拡大し,新たに提案したレジスタヒストグラム類似度を含むいくつかの客観的指標を用いて,拡張結果におけるVLIモデルが音楽境界を保存する程度について検討する。
その結果,VLIモデルは拡張タスクに対処できる可能性が示唆された。
関連論文リスト
- PerceiverS: A Multi-Scale Perceiver with Effective Segmentation for Long-Term Expressive Symbolic Music Generation [5.201151187019607]
PerceiverS(セグメンテーション・アンド・スケール)は、長い構造化された表現力のある音楽を生成するために設計された新しいアーキテクチャである。
本手法は,長期的構造的依存関係と短期的表現的詳細を同時に学習することにより,記号的音楽生成を促進する。
Maestroのようなデータセットで評価された提案モデルは、コヒーレントで多様な音楽を生成する改善を実証する。
論文 参考訳(メタデータ) (2024-11-13T03:14:10Z) - Multi-view MidiVAE: Fusing Track- and Bar-view Representations for Long
Multi-track Symbolic Music Generation [50.365392018302416]
長い多トラックのシンボリック・ミュージックを効果的にモデル化・生成するVAE手法の先駆者の一つであるMulti-view MidiVAEを提案する。
我々は,ハイブリッドな変分符号化・復号化戦略を用いて,楽器の特徴と調和,および楽曲のグローバルおよびローカルな情報に焦点をあてる。
論文 参考訳(メタデータ) (2024-01-15T08:41:01Z) - LISA++: An Improved Baseline for Reasoning Segmentation with Large
Language Model [54.850048630298495]
既存のLISAモデルの更新であるLISA++を導入し、基本アーキテクチャをそのまま維持しながらコア機能の改善に重点を置いている。
インスタンスセグメンテーション機能が追加され、既存のマルチリージョンセグメンテーションとともに、より詳細なシーン分析が提供される。
これらの改善は、構造的変化やデータソースを追加することなく、セグメンテーションと会話スキルを強化することを目的とした、ジェネリックセグメンテーションデータセットの既存のサンプルをキュレートすることで達成される。
論文 参考訳(メタデータ) (2023-12-28T18:58:33Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - Symbolic Music Structure Analysis with Graph Representations and
Changepoint Detection Methods [1.1677169430445211]
シンボリック音楽の形式や構造を,ノルム,G-PELT,G-Windowの3つの手法を提案する。
我々は,記号曲をグラフ表現で符号化し,隣接行列の斬新さを計算することで,記号曲の構造をうまく表現できることを発見した。
論文 参考訳(メタデータ) (2023-03-24T09:45:11Z) - Multitrack Music Transformer [36.91519546327085]
短いシーケンス長を維持しながら多様な楽器のセットを表現できる新しいマルチトラック音楽表現を提案する。
提案するMultitrack Music Transformer (MMT) は,最先端システムと同等の性能を実現する。
論文 参考訳(メタデータ) (2022-07-14T15:06:37Z) - A Comparative Study of Feature Expansion Unit for 3D Point Cloud
Upsampling [70.16140506187475]
既存の機能拡張ユニットのほとんどは、各ポイント機能を独立して処理していることを示す。
画像超解像のアップサンプリングモジュールに着想を得て,ProEdgeShuffleという機能拡張ユニットを提案する。
論文 参考訳(メタデータ) (2022-05-19T14:36:46Z) - Uncovering audio patterns in music with Nonnegative Tucker Decomposition
for structural segmentation [0.0]
本研究では,ノンネガティブ・タッカー・デコンポジットトン(NTD)の音楽的パターンと構造を音声形式で明らかにする能力を検討する。
NTDがいくつかのパターンの線形結合としてバーの内容を表現する傾向にあるという事実をエクスプロイトし、対応する圧縮空間で繰り返しモチーフを捕捉して取り出す分解能力を示す。
論文 参考訳(メタデータ) (2021-04-17T15:48:24Z) - Lipreading using Temporal Convolutional Networks [57.41253104365274]
現在の単語認識モデルは,残差ネットワークと双方向Gated Recurrent Unit層で構成されている。
このモデルの限界に対処し、その性能をさらに向上させる変更を提案する。
提案モデルでは,これらのデータセットにおいてそれぞれ1.2%と3.2%の絶対的な改善が得られた。
論文 参考訳(メタデータ) (2020-01-23T17:49:35Z) - Modeling Musical Structure with Artificial Neural Networks [0.0]
音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。
Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。
本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
論文 参考訳(メタデータ) (2020-01-06T18:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。