論文の概要: How Will Your Tweet Be Received? Predicting the Sentiment Polarity of
Tweet Replies
- arxiv url: http://arxiv.org/abs/2104.10513v1
- Date: Wed, 21 Apr 2021 13:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 19:23:35.471840
- Title: How Will Your Tweet Be Received? Predicting the Sentiment Polarity of
Tweet Replies
- Title(参考訳): ツイートはどのように受信されるのか?
ツイート応答の感情極性の予測
- Authors: Soroosh Tayebi Arasteh, Mehrpad Monajem, Vincent Christlein, Philipp
Heinrich, Anguelos Nicolaou, Hamidreza Naderi Boldaji, Mahshad Lotfinia,
Stefan Evert
- Abstract要約: 我々は新しいタスクを提案する:与えられたツイートに対する(第一次)応答の主観的な感情を予測する。
私たちは、感情ラベルを手動でアノテートしたツイートと返信の大規模なデータセットであるRETWEETを作成します。
自動ラベル付きデータを使用して、ニューラルネットワークの教師付きトレーニングを行い、元のツイートからの返信感情を予測する。
- 参考スコア(独自算出の注目度): 3.5263924621989196
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Twitter sentiment analysis, which often focuses on predicting the polarity of
tweets, has attracted increasing attention over the last years, in particular
with the rise of deep learning (DL). In this paper, we propose a new task:
predicting the predominant sentiment among (first-order) replies to a given
tweet. Therefore, we created RETWEET, a large dataset of tweets and replies
manually annotated with sentiment labels. As a strong baseline, we propose a
two-stage DL-based method: first, we create automatically labeled training data
by applying a standard sentiment classifier to tweet replies and aggregating
its predictions for each original tweet; our rationale is that individual
errors made by the classifier are likely to cancel out in the aggregation step.
Second, we use the automatically labeled data for supervised training of a
neural network to predict reply sentiment from the original tweets. The
resulting classifier is evaluated on the new RETWEET dataset, showing promising
results, especially considering that it has been trained without any manually
labeled data. Both the dataset and the baseline implementation are publicly
available.
- Abstract(参考訳): Twitterの感情分析は、しばしばツイートの極性を予測することに重点を置いているが、近年、特にディープラーニング(DL)の台頭によって注目を集めている。
本稿では,あるツイートに対する(一階の)回答の主観的感情を予測するという新しいタスクを提案する。
そこで我々は,感情ラベルを手動でアノテートしたツイートと返信の大規模なデータセットであるRETWEETを開発した。
まず、標準感情分類器を適用して、回答をツイートし、元のツイートごとに予測を集約することで、自動的にラベル付けされたトレーニングデータを作成する。
次に、自動ラベル付きデータを用いて、ニューラルネットワークの教師付きトレーニングを行い、元のツイートからの応答感情を予測する。
得られた分類器は、新しいRETWEETデータセットで評価され、特に手動でラベル付けされたデータなしでトレーニングされていることを考慮して、有望な結果を示す。
データセットとベースライン実装の両方が公開されている。
関連論文リスト
- Real-Time Summarization of Twitter [9.034423337410274]
我々は、リアルタイムプッシュ通知のシナリオに焦点を当て、システムはサンプルツイートのストリームを監視し、特定の興味のあるプロフィールに関連するつぶやきを返す必要がある。
ツイートが特定の関心プロファイルに関連するかどうかを分類するために、Dirichletスコアと、非常にスムーズな(ベースライン)で採用しています。
また、プッシュキューから冗長なツイートを削除することも望まれる。
論文 参考訳(メタデータ) (2024-07-11T01:56:31Z) - Co-training for Low Resource Scientific Natural Language Inference [65.37685198688538]
遠隔教師付きラベルに分類器のトレーニング力学に基づいて重みを割り当てる新しいコトレーニング手法を提案する。
予測された信頼度に対する任意のしきい値に基づいてサンプルをフィルタリングするのではなく、重要重みを割り当てることにより、自動ラベル付きデータの使用を最大化する。
提案手法は、遠隔監視ベースラインに対するマクロF1の1.5%の改善と、他の強力なSSLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-06-20T18:35:47Z) - Context-Based Tweet Engagement Prediction [0.0]
この論文は、ツイートのエンゲージメントの可能性を予測するために、コンテキスト単独がいかにうまく使われるかを調査する。
私たちはTU WienのLittle Big Data ClusterにSparkエンジンを使用して、スケーラブルなデータ前処理、機能エンジニアリング、機能選択、マシンラーニングパイプラインを作成しました。
また, 予測アルゴリズム, トレーニングデータセットサイズ, トレーニングデータセットサンプリング手法, 特徴選択などの因子が, 結果に有意な影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2023-09-28T08:36:57Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Taureau: A Stock Market Movement Inference Framework Based on Twitter
Sentiment Analysis [0.0]
我々はTwitterの感情分析を利用して株式市場の動きを予測するフレームワークTaureauを提案する。
まずはTweepyとgetOldTweetsを使って、一連のトップ企業の世論を示す歴史的なツイートを入手する。
得られた感情スコアの時間次元を月次株価変動データと相関する。
論文 参考訳(メタデータ) (2023-03-30T19:12:08Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Exploiting Twitter as Source of Large Corpora of Weakly Similar Pairs
for Semantic Sentence Embeddings [3.8073142980733]
本稿では,言語に依存しない2組の非公式テキストのデータセットを構築する手法を提案する。
ツイートの返信と引用という、Twitterの本質的な強力な関連性のシグナルを利用しています。
我々のモデルは古典的セマンティックテキスト類似性を学習するだけでなく、文のペアが正確なパラフレーズではないタスクにも長けている。
論文 参考訳(メタデータ) (2021-10-05T13:21:40Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Self-training Improves Pre-training for Natural Language Understanding [63.78927366363178]
我々は、半教師付き学習を通じてラベルのないデータを活用する別の方法として、自己学習について研究する。
本稿では,ラベル付きデータからタスク固有のクエリの埋め込みを計算するデータ拡張手法であるSentAugmentを紹介する。
我々のアプローチは、標準的なテキスト分類ベンチマークで最大2.6%の改善を達成し、スケーラブルで効果的な自己学習に繋がる。
論文 参考訳(メタデータ) (2020-10-05T17:52:25Z) - Hate Speech Detection and Racial Bias Mitigation in Social Media based
on BERT model [1.9336815376402716]
本稿では,既存の学習済み言語モデルであるBERTに基づくヘイトスピーチ検出のための伝達学習手法を提案する。
提案したモデルは、人種差別、セクシズム、憎悪、攻撃的なコンテンツをTwitter上で注釈付けした2つの公開データセット上で評価する。
論文 参考訳(メタデータ) (2020-08-14T16:47:25Z) - Semi-Supervised Models via Data Augmentationfor Classifying Interactive
Affective Responses [85.04362095899656]
本稿では、対話型感情応答を分類する半教師付きテキスト分類システムSMDA(Data Augmentation)を提案する。
ラベル付き文に対しては,ラベル分布の均一化と学習過程における教師付き損失の計算のためにデータ拡張を行った。
ラベルなし文に対しては,ラベルなし文に対する低エントロピー予測を擬似ラベルとして検討した。
論文 参考訳(メタデータ) (2020-04-23T05:02:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。