論文の概要: A Framework for Generating Annotated Social Media Corpora with
Demographics, Stance, Civility, and Topicality
- arxiv url: http://arxiv.org/abs/2012.05444v1
- Date: Thu, 10 Dec 2020 04:06:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 23:33:48.199784
- Title: A Framework for Generating Annotated Social Media Corpora with
Demographics, Stance, Civility, and Topicality
- Title(参考訳): デモグラフィック, スタンス, 市民性, トピックスを用いたアノテーション付きソーシャルメディアコーパス作成フレームワーク
- Authors: Shubhanshu Mishra, Daniel Collier
- Abstract要約: ソーシャルメディアテキストコーポラを様々なカテゴリにアノテートするためのフレームワークを紹介します。
facebookのコメントコーポラを、性別、軍事関係、年齢グループ、政治的傾倒、人種、スタンス、トピックアリーティ、ネオリベラルな見解、コメントの市民性にアノテートした学生ローン議論のケーススタディを用いています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper we introduce a framework for annotating a social media text
corpora for various categories. Since, social media data is generated via
individuals, it is important to annotate the text for the individuals
demographic attributes to enable a socio-technical analysis of the corpora.
Furthermore, when analyzing a large data-set we can often annotate a small
sample of data and then train a prediction model using this sample to annotate
the full data for the relevant categories. We use a case study of a Facebook
comment corpora on student loan discussion which was annotated for gender,
military affiliation, age-group, political leaning, race, stance, topicalilty,
neoliberlistic views and civility of the comment. We release three datasets of
Facebook comments for further research at:
https://github.com/socialmediaie/StudentDebtFbComments
- Abstract(参考訳): 本稿では,ソーシャルメディアのテキストコーパスを様々なカテゴリにアノテートするためのフレームワークを提案する。
ソーシャルメディアデータは個人によって生成されるため、個人統計属性のテキストに注釈を付け、コーパスの社会技術的分析を可能にすることが重要である。
さらに、大規模なデータセットを分析する際、小さなデータサンプルに注釈を付け、このサンプルを使用して予測モデルをトレーニングして、関連するカテゴリの完全なデータをアノテートすることができる。
facebookのコメントコーポラを、性別、軍事関係、年齢グループ、政治的傾倒、人種、スタンス、トピックアリーティ、ネオリベラルな見解、コメントの市民性にアノテートした学生ローン議論のケーススタディを用いています。
https://github.com/socialmediaie/studentdebtfbcomments.com/facebookコメントのデータセットを3つリリースし、さらなる調査を行っています。
関連論文リスト
- Reddit is all you need: Authorship profiling for Romanian [49.1574468325115]
著者プロファイリング(英: Authorship profiling)とは、著者の著作に基づいて著者の特徴を特定する過程である。
本稿では,ルーマニア語における短いテキストのコーパスについて紹介する。
論文 参考訳(メタデータ) (2024-10-13T16:27:31Z) - "A Tale of Two Movements": Identifying and Comparing Perspectives in
#BlackLivesMatter and #BlueLivesMatter Movements-related Tweets using Weakly
Supervised Graph-based Structured Prediction [24.02026820625265]
ソーシャルメディアは、オンライン社会運動の形成を促進することによって、社会変革の主要な原動力となっている。
我々は#BackLivesMatter関連ツイートの視点を明示的にモデル化する弱い教師付きグラフベースのアプローチを提案する。
論文 参考訳(メタデータ) (2023-10-11T03:01:42Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - GREENER: Graph Neural Networks for News Media Profiling [24.675574340841163]
本稿では,ウェブ上でのニュースメディアのプロファイリングの問題について,その実態と偏見について考察する。
私たちの主な焦点は、オーディエンスの重複に基づいて、メディア間の類似性をモデル化することにあります。
予測精度は2つのタスクに対して2.5-27マクロF1ポイント向上した。
論文 参考訳(メタデータ) (2022-11-10T12:46:29Z) - Sentiment Analysis with R: Natural Language Processing for
Semi-Automated Assessments of Qualitative Data [0.0]
本チュートリアルでは、Rを用いて感情分析を行うための基本的な機能を紹介し、テキスト文書を段階的に分析する方法を説明する。
2つの政治演説の比較は、可能なユースケースを示している。
論文 参考訳(メタデータ) (2022-06-25T13:25:39Z) - A Large-scale Dataset for Hate Speech Detection on Vietnamese Social
Media Texts [0.32228025627337864]
ViHSDは、ソーシャルネットワーク上でヘイトスピーチを自動的に検出する人間アノテーション付きデータセットである。
このデータセットには30,000以上のコメントが含まれており、データセットの各コメントにはCLEAN、OFENSIVE、HATEの3つのラベルの1つが含まれている。
論文 参考訳(メタデータ) (2021-03-22T00:55:47Z) - Content-based Analysis of the Cultural Differences between TikTok and
Douyin [95.32409577885645]
ショートフォームのソーシャルメディアは、聴衆にダイナミックなストーリーを伝え、彼らの注意を引き付けることによって、伝統的なメディアパラダイムから遠ざかる。
特に、興味深く、理解しやすいユニークなシーンを表現するために、日常的なオブジェクトの異なる組み合わせを用いることができる。
同じ会社によって提供されたTikTokとDouyinは、近年人気になった新しいメディアの好例だ。
メディアファッションや社会的慣用性とともに文化的な違いを表現しているという仮説が,本研究の主目的である。
論文 参考訳(メタデータ) (2020-11-03T01:47:49Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Echo Chambers on Social Media: A comparative analysis [64.2256216637683]
本研究では,4つのソーシャルメディアプラットフォーム上で100万ユーザが生成した100万個のコンテンツに対して,エコーチャンバーの操作的定義を導入し,大規模な比較分析を行う。
議論の的になっているトピックについてユーザの傾きを推測し、異なる特徴を分析してインタラクションネットワークを再構築する。
我々は、Facebookのようなニュースフィードアルゴリズムを実装するプラットフォームが、エコーチャンバの出現を招きかねないという仮説を支持する。
論文 参考訳(メタデータ) (2020-04-20T20:00:27Z) - Contrastive Examples for Addressing the Tyranny of the Majority [83.93825214500131]
我々は,グループメンバーシップを介在する,オリジナルのデータセットと新たなデータポイントからなるバランスの取れたトレーニングデータセットを作成することを提案する。
コントラッシブ・サンプル(英語版)と呼ばれるこれらのデータポイントを学習するための強力なツールとして、現在の生成的敵ネットワークが重要であることを示す。
論文 参考訳(メタデータ) (2020-04-14T14:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。