論文の概要: YT-30M: A multi-lingual multi-category dataset of YouTube comments
- arxiv url: http://arxiv.org/abs/2412.03465v1
- Date: Wed, 04 Dec 2024 16:54:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-05 15:10:20.723330
- Title: YT-30M: A multi-lingual multi-category dataset of YouTube comments
- Title(参考訳): YT-30M:YouTubeコメントの多言語マルチカテゴリデータセット
- Authors: Hridoy Sankar Dutta,
- Abstract要約: YT-30M(フル)とYT-100K(YT-30Mからランダムに選択された100Kサンプル)は、さらなる研究のために公開された。
YT-30M(YT-100K)には、YouTubeチャンネルが投稿した32236173のコメントが含まれている。
- 参考スコア(独自算出の注目度): 4.234068208406791
- License:
- Abstract: This paper introduces two large-scale multilingual comment datasets, YT-30M (and YT-100K) from YouTube. The analysis in this paper is performed on a smaller sample (YT-100K) of YT-30M. Both the datasets: YT-30M (full) and YT-100K (randomly selected 100K sample from YT-30M) are publicly released for further research. YT-30M (YT-100K) contains 32236173 (108694) comments posted by YouTube channel that belong to YouTube categories. Each comment is associated with a video ID, comment ID, commentor name, commentor channel ID, comment text, upvotes, original channel ID and category of the YouTube channel (e.g., 'News & Politics', 'Science & Technology', etc.).
- Abstract(参考訳): 本稿では,YouTubeの大規模多言語コメントデータセットYT-30MとYT-100Kを紹介する。
本稿では,YT-30Mのより小さな試料 (YT-100K) を用いて解析を行った。
YT-30M(フル)とYT-100K(YT-30Mからランダムに選択された100Kサンプル)の2つのデータセットが、さらなる研究のために公開されている。
YT-30M (YT-100K) には、YouTubeチャンネルが投稿した32236173 (108694) コメントが含まれている。
各コメントには、ビデオID、コメントID、コメントチャネル名、コメントチャネルID、コメントテキスト、アップボイト、オリジナルチャンネルID、YouTubeチャンネルのカテゴリ(例:'News & Politics'、'Science & Technology'など)が関連付けられている。
関連論文リスト
- HOTVCOM: Generating Buzzworthy Comments for Videos [49.39846630199698]
この研究は、中国最大のビデオコンテンツデータセットであるtextscHotVComを紹介し、94万の多様なビデオと1億1700万のコメントからなる。
また、中国語のビデオデータセット上で、視覚的、聴覚的、テキスト的データを相乗的に統合し、影響力のあるホットコンテンツを生成するtexttComHeatフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-23T16:45:13Z) - Can Language Models Laugh at YouTube Short-form Videos? [40.47384055149102]
ユーザ生成したYouTubeから10Kのマルチモーダルな面白いビデオのデータセット、ExFunTubeをキュレートします。
GPT-3.5を用いたビデオフィルタリングパイプラインを用いて,ユーモアに寄与する言語的要素と視覚的要素の両方を検証する。
フィルタリング後、各ビデオにタイムスタンプとテキスト説明をアノテートします。
論文 参考訳(メタデータ) (2023-10-22T03:01:38Z) - ViCo: Engaging Video Comment Generation with Human Preference Rewards [68.50351391812723]
ビデオコメント生成の課題に対処するために,3つの新しいデザインのViCoを提案する。
コメントのエンゲージメントを定量化するために、各コメントが受け取る「いいね!
コメントのエンゲージメントを自動的に評価するために、我々は報酬モデルをトレーニングし、その判断を上記のプロキシに合わせる。
論文 参考訳(メタデータ) (2023-08-22T04:01:01Z) - 3MASSIV: Multilingual, Multimodal and Multi-Aspect dataset of Social
Media Short Videos [72.69052180249598]
ソーシャルメディアプラットフォームであるMojから抽出した多言語・多言語・多言語・多言語・多言語・多言語・専門的な短いビデオのデータセットである3MASSIVを提示する。
3MASSIVは、11言語で50Kのショートビデオ(平均20秒)と100Kの未ラベルビデオで構成されている。
本稿では,3MASSIVにおけるソーシャルメディアの内容がどのように動的かつ時間的であり,意味理解タスクや言語間分析に利用することができるかを示す。
論文 参考訳(メタデータ) (2022-03-28T02:47:01Z) - Subjective and Objective Analysis of Streamed Gaming Videos [60.32100758447269]
ゲームビデオにおける主観的および客観的ビデオ品質評価(VQA)モデルについて検討する。
LIVE-YouTube Gaming Video Quality (LIVE-YT-Gaming) と呼ばれる新しいゲームビデオリソースを作成しました。
このデータについて主観的人間調査を行い,61名の被験者が記録した品質評価18,600名を得た。
論文 参考訳(メタデータ) (2022-03-24T03:02:57Z) - The MeLa BitChute Dataset [0.0]
我々は、ソーシャルビデオホスティングプラットフォームBitChuteから、約2.5年間(2019年6月から2021年12月まで)に61Kチャンネルから3Mビデオのほぼ完全なデータセットを提示する。
コメント、チャンネルの説明、各ビデオのビューなど、さまざまなビデオレベルのメタデータが含まれています。
論文 参考訳(メタデータ) (2022-02-10T23:12:28Z) - Classifying YouTube Comments Based on Sentiment and Type of Sentence [0.0]
我々は、よく知られた統計測度と機械学習モデルを用いて、YouTubeコメントからのテキスト抽出と分類の課題に対処する。
その結果,従来の手法を取り入れた手法が,コンテンツ制作者のチャンネルにおける視聴者エンゲージメント向上に有効であることを示す。
論文 参考訳(メタデータ) (2021-10-31T18:08:10Z) - YouNiverse: Large-Scale Channel and Video Metadata from English-Speaking
YouTube [15.03145814947425]
YouNiverseは、英語のYouTubeのチャンネルとビデオメタデータの大規模なコレクションである。
2005年5月から2019年10月までに発行された136Kチャンネルと72.9Mビデオのメタデータで構成されている。
データセットには、コメントされた4億4900万人の匿名ユーザのセットのビデオを指定するテーブルも含まれている。
論文 参考訳(メタデータ) (2020-12-18T17:46:47Z) - Understanding YouTube Communities via Subscription-based Channel
Embeddings [0.0]
本稿では,YouTubeチャンネルの発見と分類を行う新しい手法を提案する。
これらの手法は、コメントの公開購読ページを活用する自己教師付き学習アプローチを使用する。
異なる政治コンテンツへのトラフィック量を分析するために、新しいデータセットを作成します。
論文 参考訳(メタデータ) (2020-10-19T22:00:04Z) - Mi YouTube es Su YouTube? Analyzing the Cultures using YouTube
Thumbnails of Popular Videos [98.87558262467257]
本研究では,YouTubeのトレンド動画のサムネイルを用いて,各国の文化選好について検討した。
実験の結果、類似文化のユーザーはYouTubeで同様のビデオを見ることに興味を持っていることがわかった。
論文 参考訳(メタデータ) (2020-01-27T20:15:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。