論文の概要: TIMME: Twitter Ideology-detection via Multi-task Multi-relational
Embedding
- arxiv url: http://arxiv.org/abs/2006.01321v3
- Date: Thu, 18 Jun 2020 05:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 23:27:00.392440
- Title: TIMME: Twitter Ideology-detection via Multi-task Multi-relational
Embedding
- Title(参考訳): timme: マルチタスクマルチリレーショナル埋め込みによるtwitterのイデオロギー検出
- Authors: Zhiping Xiao, Weiping Song, Haoyan Xu, Zhicheng Ren, Yizhou Sun
- Abstract要約: 我々は、人々のイデオロギーや政治的傾向を予測する問題を解決することを目的としている。
我々は、Twitterデータを用いてそれを推定し、分類問題として定式化する。
- 参考スコア(独自算出の注目度): 26.074367752142198
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We aim at solving the problem of predicting people's ideology, or political
tendency. We estimate it by using Twitter data, and formalize it as a
classification problem. Ideology-detection has long been a challenging yet
important problem. Certain groups, such as the policy makers, rely on it to
make wise decisions. Back in the old days when labor-intensive survey-studies
were needed to collect public opinions, analyzing ordinary citizens' political
tendencies was uneasy. The rise of social medias, such as Twitter, has enabled
us to gather ordinary citizen's data easily. However, the incompleteness of the
labels and the features in social network datasets is tricky, not to mention
the enormous data size and the heterogeneousity. The data differ dramatically
from many commonly-used datasets, thus brings unique challenges. In our work,
first we built our own datasets from Twitter. Next, we proposed TIMME, a
multi-task multi-relational embedding model, that works efficiently on
sparsely-labeled heterogeneous real-world dataset. It could also handle the
incompleteness of the input features. Experimental results showed that TIMME is
overall better than the state-of-the-art models for ideology detection on
Twitter. Our findings include: links can lead to good classification outcomes
without text; conservative voice is under-represented on Twitter; follow is the
most important relation to predict ideology; retweet and mention enhance a
higher chance of like, etc. Last but not least, TIMME could be extended to
other datasets and tasks in theory.
- Abstract(参考訳): 我々は、人々のイデオロギーや政治的傾向を予測する問題を解決することを目指している。
我々はtwitterのデータを用いて推定し,分類問題として定式化する。
イデオロギー検出は長い間、難しいが重要な問題であった。
政策立案者のような特定のグループは、賢明な決定をするためにそれに依存する。
国民の意見を集めるために労働集約的な調査研究が必要だった昔、一般市民の政治的傾向の分析は不安だった。
Twitterなどのソーシャルメディアの普及により、一般市民のデータを簡単に収集できるようになりました。
しかし、ラベルの不完全さとソーシャルネットワークデータセットの特徴は、膨大なデータサイズと不均一性だけでなく、難解である。
データは、多くの一般的なデータセットと劇的に異なり、ユニークな課題をもたらす。
私たちはまず、Twitterから独自のデータセットを構築しました。
次に,マルチタスクのマルチリレーショナル埋め込みモデルであるTIMMEを提案する。
また、入力機能の不完全性も処理できる。
実験の結果,TIMMEはTwitter上でのイデオロギー検出の最先端モデルよりも総合的に優れていることがわかった。
リンクがテキストなしで良い分類結果をもたらすこと、保守的な音声がTwitterで表現されていないこと、フォローがイデオロギーを予測する上で最も重要な関係であること、リツイートと言及が好ましくない可能性を高めること、などである。
最後に、TIMMEは理論上の他のデータセットやタスクにも拡張できる。
関連論文リスト
- ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Detecting Political Opinions in Tweets through Bipartite Graph Analysis:
A Skip Aggregation Graph Convolution Approach [9.350629400940493]
私たちは2020年の米国大統領選挙に集中し、Twitterから大規模なデータセットを作成します。
ツイート中の政治的意見を検出するために,ユーザの投稿行動とリツイート行動に基づいて,ユーザツイートの2部グラフを構築した。
ツイートノードに2階隣人からの情報を集約する新しいスキップアグリゲーション機構を導入する。
論文 参考訳(メタデータ) (2023-04-22T10:38:35Z) - DoubleH: Twitter User Stance Detection via Bipartite Graph Neural
Networks [9.350629400940493]
2020年の米国大統領選挙の大規模なデータセットをクロールし、手動でタグ付けされたハッシュタグによって、すべてのユーザーを自動的にラベル付けします。
本稿では,二部グラフニューラルネットワークモデルであるDoubleHを提案する。
論文 参考訳(メタデータ) (2023-01-20T19:20:10Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Decay No More: A Persistent Twitter Dataset for Learning Social Meaning [10.227026799075215]
社会意味のための英語Twitterデータセット(PTSM)を提案する。
PTSMは17ドルのソーシャル意味データセットと10ドルのタスクカテゴリで構成されている。
我々は2つのSOTA事前訓練言語モデルを用いて実験を行い、PTSMが実際のツイートをパラフレーズに置換し、性能損失を極端に抑えることを示した。
論文 参考訳(メタデータ) (2022-04-10T06:07:54Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。
近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。
知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文 参考訳(メタデータ) (2021-10-27T12:19:56Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z) - Stance in Replies and Quotes (SRQ): A New Dataset For Learning Stance in
Twitter Conversations [8.097870074875729]
我々は5200以上のスタンスラベルを持つTwitter会話のための人間ラベル付きスタンスデータセットを提示する。
会話の姿勢を学習し、様々なモデルのパフォーマンスを比較するためのベースラインモデルが多数含まれています。
論文 参考訳(メタデータ) (2020-06-01T03:30:08Z) - Contrastive Examples for Addressing the Tyranny of the Majority [83.93825214500131]
我々は,グループメンバーシップを介在する,オリジナルのデータセットと新たなデータポイントからなるバランスの取れたトレーニングデータセットを作成することを提案する。
コントラッシブ・サンプル(英語版)と呼ばれるこれらのデータポイントを学習するための強力なツールとして、現在の生成的敵ネットワークが重要であることを示す。
論文 参考訳(メタデータ) (2020-04-14T14:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。