論文の概要: Classifying YouTube Comments Based on Sentiment and Type of Sentence
- arxiv url: http://arxiv.org/abs/2111.01908v1
- Date: Sun, 31 Oct 2021 18:08:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 14:03:17.671618
- Title: Classifying YouTube Comments Based on Sentiment and Type of Sentence
- Title(参考訳): 感性と文のタイプに基づくYouTubeコメントの分類
- Authors: Rhitabrat Pokharel and Dixit Bhatta
- Abstract要約: 我々は、よく知られた統計測度と機械学習モデルを用いて、YouTubeコメントからのテキスト抽出と分類の課題に対処する。
その結果,従来の手法を取り入れた手法が,コンテンツ制作者のチャンネルにおける視聴者エンゲージメント向上に有効であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As a YouTube channel grows, each video can potentially collect enormous
amounts of comments that provide direct feedback from the viewers. These
comments are a major means of understanding viewer expectations and improving
channel engagement. However, the comments only represent a general collection
of user opinions about the channel and the content. Many comments are poorly
constructed, trivial, and have improper spellings and grammatical errors. As a
result, it is a tedious job to identify the comments that best interest the
content creators. In this paper, we extract and classify the raw comments into
different categories based on both sentiment and sentence types that will help
YouTubers find relevant comments for growing their viewership. Existing studies
have focused either on sentiment analysis (positive and negative) or
classification of sub-types within the same sentence types (e.g., types of
questions) on a text corpus. These have limited application on non-traditional
text corpus like YouTube comments. We address this challenge of text extraction
and classification from YouTube comments using well-known statistical measures
and machine learning models. We evaluate each combination of statistical
measure and the machine learning model using cross validation and $F_1$ scores.
The results show that our approach that incorporates conventional methods
performs well on the classification task, validating its potential in assisting
content creators increase viewer engagement on their channel.
- Abstract(参考訳): YouTubeチャンネルが大きくなると、各ビデオは膨大な量のコメントを集め、視聴者から直接フィードバックを得られる。
これらのコメントは視聴者の期待を理解し、チャンネルのエンゲージメントを改善する主要な手段だ。
しかし、コメントはチャンネルとコンテンツに関する一般的なユーザの意見の集まりを表すだけである。
多くのコメントは貧弱で、自明で、不適切な綴りや文法上の誤りがある。
結果として、コンテンツクリエイターが最も興味を持つコメントを特定するのは退屈な仕事です。
本稿では、感情と文のタイプに基づいて、生のコメントを異なるカテゴリに分けて抽出し、視聴者の関心を増すための関連コメントを見つけるのに役立つ。
既存の研究では、テキストコーパス上の同じ文タイプ(例えば、質問の種類)における感情分析(肯定的および否定的)またはサブタイプの分類に焦点を当てている。
これらはYouTubeコメントのような従来のテキストコーパスに限られている。
我々は、よく知られた統計測度と機械学習モデルを用いて、YouTubeコメントからのテキスト抽出と分類の課題に対処する。
統計的尺度と機械学習モデルの組み合わせをクロス検証と$f_1$スコアを用いて評価する。
その結果,従来の手法を組み込んだアプローチは分類作業において良好に機能し,コンテンツクリエーターのチャンネルへのエンゲージメント向上を支援する可能性を検証することができた。
関連論文リスト
- CineXDrama: Relevance Detection and Sentiment Analysis of Bangla YouTube Comments on Movie-Drama using Transformers: Insights from Interpretability Tool [0.0]
本稿では,まずコメントの関連性を評価し,関連するものに対する感情分析を行うシステムを提案する。
手作業で収集した14,000のコメントと前処理されたコメントのデータセットを導入し、関連性(関連性または非関連性)と感情(肯定的または否定的)に注釈を付ける。
論文 参考訳(メタデータ) (2024-11-10T18:04:41Z) - HOTVCOM: Generating Buzzworthy Comments for Videos [49.39846630199698]
この研究は、中国最大のビデオコンテンツデータセットであるtextscHotVComを紹介し、94万の多様なビデオと1億1700万のコメントからなる。
また、中国語のビデオデータセット上で、視覚的、聴覚的、テキスト的データを相乗的に統合し、影響力のあるホットコンテンツを生成するtexttComHeatフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-23T16:45:13Z) - ViCo: Engaging Video Comment Generation with Human Preference Rewards [68.50351391812723]
ビデオコメント生成の課題に対処するために,3つの新しいデザインのViCoを提案する。
コメントのエンゲージメントを定量化するために、各コメントが受け取る「いいね!
コメントのエンゲージメントを自動的に評価するために、我々は報酬モデルをトレーニングし、その判断を上記のプロキシに合わせる。
論文 参考訳(メタデータ) (2023-08-22T04:01:01Z) - Models See Hallucinations: Evaluating the Factuality in Video Captioning [57.85548187177109]
ビデオキャプションにおける実感の人間による評価を行い、2つの注釈付き実感データセットを収集する。
モデル生成文の57.0%に事実誤りがあり、この分野では深刻な問題であることを示す。
本稿では,映像キャプションの事実性評価において,従来の指標より優れていたモデルベース事実性指標FactVCを提案する。
論文 参考訳(メタデータ) (2023-03-06T08:32:50Z) - EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained
Embedding Matching [90.98122161162644]
現在のビデオキャプションの指標は、主に参照キャプションと候補キャプションのテキストレベルの比較に基づいている。
EMScore(Embedding Matching-based score)を提案する。
我々は、よく訓練された視覚言語モデルを用いて、EMScore 計算のための視覚的および言語的埋め込みを抽出する。
論文 参考訳(メタデータ) (2021-11-17T06:02:43Z) - Stay on Topic, Please: Aligning User Comments to the Content of a News
Article [7.3203631241415055]
新たな記事ベースに投稿されたユーザコメントとその内容との整合性を分類する分類アルゴリズムを提案する。
このアライメントは、コンテンツ、議論のエンティティ、トピック間の類似性に基づいて、ユーザーコメントと記事とを一致させようとする。
分類作業の難易度を理解するために,人間のラベル付け性能を評価するためのユーザ調査を行う。
論文 参考訳(メタデータ) (2021-03-03T18:29:00Z) - Understanding YouTube Communities via Subscription-based Channel
Embeddings [0.0]
本稿では,YouTubeチャンネルの発見と分類を行う新しい手法を提案する。
これらの手法は、コメントの公開購読ページを活用する自己教師付き学習アプローチを使用する。
異なる政治コンテンツへのトラフィック量を分析するために、新しいデータセットを作成します。
論文 参考訳(メタデータ) (2020-10-19T22:00:04Z) - Cooking Is All About People: Comment Classification On Cookery Channels
Using BERT and Classification Models (Malayalam-English Mix-Code) [0.0]
我々は、英語とマラヤラムの異なる組み合わせの混合であるコメントを分類するために、トップパフォーマンスの分類モデルを評価した。
以上の結果から,K-Nearest Neighbors(KNN),SVM(Support Vector Machine),ランダムフォレスト(Random Forest),決定木(Decision Trees)がコメント分類において同様の精度を提供することがわかった。
論文 参考訳(メタデータ) (2020-06-15T19:07:06Z) - A Unified Dual-view Model for Review Summarization and Sentiment
Classification with Inconsistency Loss [51.448615489097236]
ユーザーレビューから正確な要約と感情を取得することは、現代のEコマースプラットフォームにとって不可欠な要素である。
本稿では,これら2つのタスクの性能を協調的に改善する新しいデュアルビューモデルを提案する。
異なる領域の4つの実世界のデータセットに対する実験結果から,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-06-02T13:34:11Z) - Mi YouTube es Su YouTube? Analyzing the Cultures using YouTube
Thumbnails of Popular Videos [98.87558262467257]
本研究では,YouTubeのトレンド動画のサムネイルを用いて,各国の文化選好について検討した。
実験の結果、類似文化のユーザーはYouTubeで同様のビデオを見ることに興味を持っていることがわかった。
論文 参考訳(メタデータ) (2020-01-27T20:15:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。