論文の概要: A Dataset for Greek Traditional and Folk Music: Lyra
- arxiv url: http://arxiv.org/abs/2211.11479v1
- Date: Mon, 21 Nov 2022 14:15:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 23:39:12.636043
- Title: A Dataset for Greek Traditional and Folk Music: Lyra
- Title(参考訳): ギリシャの伝統音楽と民俗音楽のデータセット:Lyra
- Authors: Charilaos Papaioannou, Ioannis Valiantzas, Theodoros Giannakopoulos,
Maximos Kaliakatsos-Papakostas, Alexandros Potamianos
- Abstract要約: 本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
- 参考スコア(独自算出の注目度): 69.07390994897443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Studying under-represented music traditions under the MIR scope is crucial,
not only for developing novel analysis tools, but also for unveiling musical
functions that might prove useful in studying world musics. This paper presents
a dataset for Greek Traditional and Folk music that includes 1570 pieces,
summing in around 80 hours of data. The dataset incorporates YouTube
timestamped links for retrieving audio and video, along with rich metadata
information with regards to instrumentation, geography and genre, among others.
The content has been collected from a Greek documentary series that is
available online, where academics present music traditions of Greece with live
music and dance performance during the show, along with discussions about
social, cultural and musicological aspects of the presented music. Therefore,
this procedure has resulted in a significant wealth of descriptions regarding a
variety of aspects, such as musical genre, places of origin and musical
instruments. In addition, the audio recordings were performed under strict
production-level specifications, in terms of recording equipment, leading to
very clean and homogeneous audio content. In this work, apart from presenting
the dataset in detail, we propose a baseline deep-learning classification
approach to recognize the involved musicological attributes. The dataset, the
baseline classification methods and the models are provided in public
repositories. Future directions for further refining the dataset are also
discussed.
- Abstract(参考訳): MIRの範囲で表現されていない音楽の伝統を研究することは、新しい分析ツールを開発するだけでなく、世界音楽を研究する上で有用な音楽機能を公開するためにも重要である。
本稿では,80時間程度で要約した1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットを提案する。
データセットには、youtubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索、インスツルメンテーション、地理、ジャンルなどに関する豊富なメタデータ情報が含まれている。
この内容は、ギリシャのドキュメンタリーシリーズから収集され、研究者がギリシャの音楽の伝統をライブ音楽とダンスの演奏で紹介し、提示された音楽の社会的、文化的、音楽学的側面について議論する。
そのため、音楽のジャンル、起源の場所、楽器など、様々な側面に関する記述が豊富に行われている。
さらに、録音装置に関して厳格な生産レベルの仕様の下で録音が行われ、非常に清潔で均質なオーディオコンテンツに繋がった。
本研究は,データセットの詳細な提示とは別に,関連する音楽的属性を認識するためのベースライン深層学習分類手法を提案する。
データセット、ベースライン分類方法、およびモデルがパブリックリポジトリで提供される。
データセットをさらに洗練するための今後の方向性についても論じる。
関連論文リスト
- CHORDONOMICON: A Dataset of 666,000 Songs and their Chord Progressions [1.8541450825478398]
Chordonomiconは666,000曲以上の楽曲とそれらのコード進行のデータセットで、構造的部分、ジャンル、リリース日が注釈付けされている。
これらの特徴により、Chordonomiconは高度な機械学習技術を探求するための理想的なテストベッドとなる。
論文 参考訳(メタデータ) (2024-10-29T13:53:09Z) - Foundation Models for Music: A Survey [77.77088584651268]
ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。
本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文 参考訳(メタデータ) (2024-08-26T15:13:14Z) - MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models [57.47799823804519]
私たちは、ミュージシャンが映画の脚本だけでなく、視覚化を通して音楽を作る方法にインスピレーションを受けています。
本稿では,テキスト記述と対応する画像からの手がかりを効果的に利用して音楽を合成するモデルであるMeLFusionを提案する。
音楽合成パイプラインに視覚情報を加えることで、生成した音楽の質が大幅に向上することを示す。
論文 参考訳(メタデータ) (2024-06-07T06:38:59Z) - MidiCaps: A large-scale MIDI dataset with text captions [6.806050368211496]
本研究の目的は,LLMとシンボリック音楽を組み合わせることで,テキストキャプションを付加した最初の大規模MIDIデータセットを提示することである。
近年のキャプション技術の発展に触発されて,テキスト記述付き168kのMIDIファイルをキュレートしたデータセットを提示する。
論文 参考訳(メタデータ) (2024-06-04T12:21:55Z) - WikiMuTe: A web-sourced dataset of semantic descriptions for music audio [7.4327407361824935]
音楽の豊かな意味記述を含む新しいオープンデータセットWikiMuTeを提案する。
このデータはウィキペディアの豊富な楽曲に関する記事のカタログから得られたものである。
我々は、テキストと音声の表現を共同で学習し、モーダル検索を行うモデルを訓練する。
論文 参考訳(メタデータ) (2023-12-14T18:38:02Z) - The Music Meta Ontology: a flexible semantic model for the
interoperability of music metadata [0.39373541926236766]
アーティスト,作曲,演奏,録音,リンクに関連する音楽メタデータを記述するために,音楽メタオントロジーを導入する。
モデルの最初の評価、他のスキーマへのアライメント、データ変換のサポートを提供します。
論文 参考訳(メタデータ) (2023-11-07T12:35:15Z) - From West to East: Who can understand the music of the others better? [91.78564268397139]
我々は、異なる音楽文化間の類似性についての洞察を導き出すために、伝達学習手法を活用する。
西洋音楽の2つのデータセット、地中海東部の文化に由来する伝統的・民族的な2つのデータセット、インドの芸術音楽に属する2つのデータセットを使用します。
CNNベースの2つのアーキテクチャとTransformerベースのアーキテクチャを含む3つのディープオーディオ埋め込みモデルがトレーニングされ、ドメイン間で転送される。
論文 参考訳(メタデータ) (2023-07-19T07:29:14Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - Music-to-Text Synaesthesia: Generating Descriptive Text from Music
Recordings [36.090928638883454]
音楽からテキストへの合成は、音楽録音から記述的なテキストを同じ感情で生成し、さらに理解することを目的としている。
音楽録音の内容を記述可能な文を生成するための計算モデルを構築した。
非差別的なクラシック音楽に対処するために,グループトポロジ保存損失を設計する。
論文 参考訳(メタデータ) (2022-10-02T06:06:55Z) - MusicBERT: Symbolic Music Understanding with Large-Scale Pre-Training [97.91071692716406]
シンボリック・ミュージックの理解(シンボリック・ミュージックの理解)とは、シンボリック・データから音楽を理解することを指す。
MusicBERTは、音楽理解のための大規模な事前訓練モデルである。
論文 参考訳(メタデータ) (2021-06-10T10:13:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。