論文の概要: Linguistic Analysis of Sinhala YouTube Comments on Sinhala Music Videos: A Dataset Study
- arxiv url: http://arxiv.org/abs/2501.18633v1
- Date: Tue, 28 Jan 2025 09:46:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 14:02:22.763534
- Title: Linguistic Analysis of Sinhala YouTube Comments on Sinhala Music Videos: A Dataset Study
- Title(参考訳): Sinhala Music VideosにおけるSinhala YouTubeコメントの言語学的分析:データセットによる検討
- Authors: W. M. Yomal De Mel, Nisansa de Silva,
- Abstract要約: 本研究では,音楽情報検索(MIR)と音楽感情認識(MER)の領域について,シンハラの楽曲との関連について検討する。
本研究の目的は,YouTube Sinhalaの楽曲ビデオにおけるSinhalaコメントの挙動を,ソーシャルメディアコメントを一次データソースとして分析することである。
- 参考スコア(独自算出の注目度): 0.2630859234884724
- License:
- Abstract: This research investigates the area of Music Information Retrieval (MIR) and Music Emotion Recognition (MER) in relation to Sinhala songs, an underexplored field in music studies. The purpose of this study is to analyze the behavior of Sinhala comments on YouTube Sinhala song videos using social media comments as primary data sources. These included comments from 27 YouTube videos containing 20 different Sinhala songs, which were carefully selected so that strict linguistic reliability would be maintained and relevancy ensured. This process led to a total of 93,116 comments being gathered upon which the dataset was refined further by advanced filtering methods and transliteration mechanisms resulting into 63,471 Sinhala comments. Additionally, 964 stop-words specific for the Sinhala language were algorithmically derived out of which 182 matched exactly with English stop-words from NLTK corpus once translated. Also, comparisons were made between general domain corpora in Sinhala against the YouTube Comment Corpus in Sinhala confirming latter as good representation of general domain. The meticulously curated data set as well as the derived stop-words form important resources for future research in the fields of MIR and MER, since they could be used and demonstrate that there are possibilities with computational techniques to solve complex musical experiences across varied cultural traditions
- Abstract(参考訳): 本研究では,音楽情報検索(MIR)と音楽感情認識(MER)の領域を,音楽研究の未研究分野であるシンハラの曲と関連づけて検討する。
本研究の目的は,YouTube Sinhalaの楽曲ビデオにおけるSinhalaコメントの挙動を,ソーシャルメディアコメントを一次データソースとして分析することである。
これには、厳格な言語的信頼性を維持し、関連性を確保するために慎重に選択された20種類のシンハラ曲を含む27のYouTubeビデオからのコメントが含まれていた。
このプロセスにより、合計93,116のコメントが収集され、データセットは高度なフィルタリング手法と翻訳機構によってさらに洗練され、63,471のシンハラコメントが得られた。
さらに、シンハラ語に特有の964の停止語がアルゴリズムによって導出され、そのうち182語はかつて翻訳されたNLTKコーパスの英語の停止語と正確に一致した。
また、シンハラの一般ドメインコーパスとシンハラのYouTubeコメントコーパスを比較し、後者が一般ドメインのよい表現であると確認した。
厳密にキュレートされたデータセットと、派生したストップワードは、MIRとMERの分野における将来の研究に重要なリソースを形成する。
関連論文リスト
- Zema Dataset: A Comprehensive Study of Yaredawi Zema with a Focus on Horologium Chants [7.062046866879682]
エチオピア正教会のテワヘド教会聖歌は、計算音楽研究において比較的少なすぎる。
本稿では, ヤレダウィ・ゼマ(Yaledawi Zema)として知られる, EOTCの唱歌の分析に適した新しいデータセットを提案する。
論文 参考訳(メタデータ) (2024-12-25T05:20:08Z) - CineXDrama: Relevance Detection and Sentiment Analysis of Bangla YouTube Comments on Movie-Drama using Transformers: Insights from Interpretability Tool [0.0]
本稿では,まずコメントの関連性を評価し,関連するものに対する感情分析を行うシステムを提案する。
手作業で収集した14,000のコメントと前処理されたコメントのデータセットを導入し、関連性(関連性または非関連性)と感情(肯定的または否定的)に注釈を付ける。
論文 参考訳(メタデータ) (2024-11-10T18:04:41Z) - MuVi: Video-to-Music Generation with Semantic Alignment and Rhythmic Synchronization [52.498942604622165]
本稿では,ビデオコンテンツに合わせた音楽を生成するためのフレームワークであるMuViについて述べる。
MuViは、特別に設計された視覚適応器を通じて映像コンテンツを分析し、文脈的および時間的に関係のある特徴を抽出する。
音声品質と時間同期の両方において, MuVi が優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2024-10-16T18:44:56Z) - Synthetic Lyrics Detection Across Languages and Genres [4.987546582439803]
音楽コンテンツ、特に歌詞を生成する大きな言語モデル(LLM)が人気を集めている。
これまで様々な領域におけるコンテンツ検出について研究されてきたが、音楽における歌詞のモダリティに焦点を当てた研究は行われていない。
我々は、複数の言語、音楽ジャンル、アーティストのリアルとシンセサイザーの多様なデータセットをキュレートした。
論文 参考訳(メタデータ) (2024-06-21T15:19:21Z) - MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models [57.47799823804519]
私たちは、ミュージシャンが映画の脚本だけでなく、視覚化を通して音楽を作る方法にインスピレーションを受けています。
本稿では,テキスト記述と対応する画像からの手がかりを効果的に利用して音楽を合成するモデルであるMeLFusionを提案する。
音楽合成パイプラインに視覚情報を加えることで、生成した音楽の質が大幅に向上することを示す。
論文 参考訳(メタデータ) (2024-06-07T06:38:59Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - Finding Tori: Self-supervised Learning for Analyzing Korean Folk Song [0.966840768820136]
1980-90年代頃の韓国民謡の約700時間におけるフィールド記録データセットの計算解析について紹介する。
ほとんどの曲は伴奏のない非熟練ミュージシャンによって歌われているため、データセットにはいくつかの課題がある。
この課題に対処するために,ピッチ輪郭に基づく畳み込みニューラルネットワークを用いた自己教師型学習を利用した。
論文 参考訳(メタデータ) (2023-08-04T11:13:15Z) - LyricSIM: A novel Dataset and Benchmark for Similarity Detection in
Spanish Song LyricS [52.77024349608834]
歌詞中の意味的類似性に合わせた新しいデータセットとベンチマークを提案する。
このデータセットはもともと2775組のスペイン語の歌で構成されており、63のネイティブアノテータによる集合アノテーション実験で注釈付けされました。
論文 参考訳(メタデータ) (2023-06-02T07:48:20Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z) - Contrastive Learning with Positive-Negative Frame Mask for Music
Representation [91.44187939465948]
本稿では,PEMRと略記したコントラッシブラーニングフレームワークに基づく,音楽表現のための正負負のフレームマスクを提案する。
我々は,同じ音楽からサンプリングした自己増強陽性/陰性の両方に対応するために,新しいコントラスト学習目標を考案した。
論文 参考訳(メタデータ) (2022-03-17T07:11:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。