論文の概要: Automatic Identification and Classification of Bragging in Social Media
- arxiv url: http://arxiv.org/abs/2203.05840v1
- Date: Fri, 11 Mar 2022 10:33:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-14 17:48:05.782184
- Title: Automatic Identification and Classification of Bragging in Social Media
- Title(参考訳): ソーシャルメディアにおけるブラッグの自動識別と分類
- Authors: Mali Jin, Daniel Preo\c{t}iuc-Pietro, A. Seza Do\u{g}ru\"oz, Nikolaos
Aletras
- Abstract要約: 本稿では,計算言語学におけるブラッギングの大規模研究について紹介する。
我々は、自慢やそのタイプに注釈を付けたツイートの、新たに公開されたデータセットを紹介します。
以上の結果から,2次・複数クラス分類タスクにおいて,マクロF1のブラッグを最大72.42,35.95まで予測できることが示唆された。
- 参考スコア(独自算出の注目度): 25.874568334146122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bragging is a speech act employed with the goal of constructing a favorable
self-image through positive statements about oneself. It is widespread in daily
communication and especially popular in social media, where users aim to build
a positive image of their persona directly or indirectly. In this paper, we
present the first large scale study of bragging in computational linguistics,
building on previous research in linguistics and pragmatics. To facilitate
this, we introduce a new publicly available data set of tweets annotated for
bragging and their types. We empirically evaluate different transformer-based
models injected with linguistic information in (a) binary bragging
classification, i.e., if tweets contain bragging statements or not; and (b)
multi-class bragging type prediction including not bragging. Our results show
that our models can predict bragging with macro F1 up to 72.42 and 35.95 in the
binary and multi-class classification tasks respectively. Finally, we present
an extensive linguistic and error analysis of bragging prediction to guide
future research on this topic.
- Abstract(参考訳): 自慢(英: bragging)とは、自分に対する肯定的な発言を通じて好意的な自己イメージを構築することを目的とした言論行為である。
日々のコミュニケーション、特にソーシャルメディアで広く普及しており、ユーザーは直接的または間接的にペルソナのポジティブなイメージを構築しようとしている。
本稿では,従来の言語学および実用学の研究をもとに,計算言語学におけるブラッグングの大規模研究を初めて実施する。
これを容易にするために、ブラッグとそのタイプに注釈を付けた新しい公開ツイートデータセットを導入する。
言語情報を用いたトランスフォーマーモデルの評価実験を行った。
(a)バイナリ・ブラッグング分類、すなわち、ツイートがブラッグング文を含むか否かを問わない場合。
(b)ブラッグを含まないマルチクラスのブラッグ型予測。
以上の結果から,マルチクラス分類タスクにおいて,マクロf1が72.42,35.95までのブギングを予測できることがわかった。
最後に,この話題の今後の研究を導くため,ブラッギング予測の言語的・誤り分析を行う。
関連論文リスト
- GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models [75.04426753720553]
開集合におけるバイアスを特定し,定量化し,説明するための枠組みを提案する。
このパイプラインはLarge Language Model (LLM)を活用して、一連のキャプションから始まるバイアスを提案する。
このフレームワークには、OpenBiasとGradBiasの2つのバリエーションがあります。
論文 参考訳(メタデータ) (2024-08-29T16:51:07Z) - Holmes: A Benchmark to Assess the Linguistic Competence of Language Models [59.627729608055006]
言語モデル(LM)の言語能力を評価するための新しいベンチマークであるHolmesを紹介する。
我々は、計算に基づく探索を用いて、異なる言語現象に関するLMの内部表現を調べる。
その結果,近年,他の認知能力からLMの言語能力を引き離す声が上がっている。
論文 参考訳(メタデータ) (2024-04-29T17:58:36Z) - Who is bragging more online? A large scale analysis of bragging in social media [31.768287848321354]
本稿では,Twitter(米国)におけるブラッグ行動の大規模研究を行うために,計算社会言語学的手法を用いる。
本研究は,同一利用者内でのブラッグの頻度が時間の経過とともに低下していることを示す。
さらに、米国の若い、より教育を受け、人気のあるユーザーは、より自慢する傾向にある。
論文 参考訳(メタデータ) (2024-03-25T12:07:21Z) - Arabic Tweet Act: A Weighted Ensemble Pre-Trained Transformer Model for
Classifying Arabic Speech Acts on Twitter [0.32885740436059047]
本稿では,トランスフォーマー深層学習ニューラルネットワークに基づくTwitter方言のアラビア音声行為分類手法を提案する。
本研究では,BERTに基づく重み付きアンサンブル学習手法を提案する。
その結果,最高のBERTモデルは平均F1スコアと0.73と0.84の精度を持つaraBERTv2-Twitterモデルであることが判明した。
論文 参考訳(メタデータ) (2024-01-30T19:01:24Z) - Towards Better Inclusivity: A Diverse Tweet Corpus of English Varieties [0.0]
私たちは、その根本にあるバイアス(データそのもの)の問題に対処することを目指しています。
英語の多言語話者の割合が低い国からのツイートのデータセットをキュレートする。
ベストプラクティスに従って、我々の成長するコーパスには7カ国から170,800のツイートが写っている。
論文 参考訳(メタデータ) (2024-01-21T13:18:20Z) - A Graph-Based Context-Aware Model to Understand Online Conversations [3.8345539498627437]
オンライン会話では、コメントや返信は、すぐに関連する情報以外の外部のコンテキストに基づいている可能性がある。
グラフウォークを用いて会話のより広いコンテキストを組み込む新しいグラフベースのディープラーニングアーキテクチャであるGraphNLIを提案する。
極性予測と擬似的ヘイトスピーチ検出という2つのタスクでGraphNLIを評価する。
論文 参考訳(メタデータ) (2022-11-16T20:51:45Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Adversarial GLUE: A Multi-Task Benchmark for Robustness Evaluation of
Language Models [86.02610674750345]
AdvGLUE(Adversarial GLUE)は、様々な種類の敵攻撃の下で、現代の大規模言語モデルの脆弱性を調査し評価するための新しいマルチタスクベンチマークである。
GLUEタスクに14の逆攻撃手法を適用してAdvGLUEを構築する。
テストしたすべての言語モデルとロバストなトレーニングメソッドは、AdvGLUEではパフォーマンスが悪く、スコアは明確な精度よりもはるかに遅れています。
論文 参考訳(メタデータ) (2021-11-04T12:59:55Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Predicting the Humorousness of Tweets Using Gaussian Process Preference
Learning [56.18809963342249]
本稿では,人間の嗜好判断と言語アノテーションの自動生成を利用して,短文のユーモラスさのランク付けと評価を学習する確率論的アプローチを提案する。
本研究は, HAHA@IberLEF 2019データにおける数値スコアの変換と, 提案手法に必要な判定アノテーションの相互変換から生じる問題点について報告する。
論文 参考訳(メタデータ) (2020-08-03T13:05:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。