論文の概要: Studying Disinformation Narratives on Social Media with LLMs and Semantic Similarity
- arxiv url: http://arxiv.org/abs/2507.20066v1
- Date: Sat, 26 Jul 2025 21:43:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.860817
- Title: Studying Disinformation Narratives on Social Media with LLMs and Semantic Similarity
- Title(参考訳): LLMと意味的類似性を用いたソーシャルメディアにおける偽情報ナラティブの検討
- Authors: Chaytan Inman,
- Abstract要約: この論文は、偽情報物語との類似性を連続的に測定する。
トレースツールは、ツイートとターゲットのナラティブを取り込み、それぞれの類似性をターゲットのナラティブに評価し、タイムラインとしてグラフ化する。
第2のナラティブ合成ツールは、ツィートを類似性のしきい値の上にクラスタし、各クラスタ内で支配的なナラティブを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This thesis develops a continuous scale measurement of similarity to disinformation narratives that can serve to detect disinformation and capture the nuanced, partial truths that are characteristic of it. To do so, two tools are developed and their methodologies are documented. The tracing tool takes tweets and a target narrative, rates the similarities of each to the target narrative, and graphs it as a timeline. The second narrative synthesis tool clusters tweets above a similarity threshold and generates the dominant narratives within each cluster. These tools are combined into a Tweet Narrative Analysis Dashboard. The tracing tool is validated on the GLUE STS-B benchmark, and then the two tools are used to analyze two case studies for further empirical validation. The first case study uses the target narrative "The 2020 election was stolen" and analyzes a dataset of Donald Trump's tweets during 2020. The second case study uses the target narrative, "Transgender people are harmful to society" and analyzes tens of thousands of tweets from the media outlets The New York Times, The Guardian, The Gateway Pundit, and Fox News. Together, the empirical findings from these case studies demonstrate semantic similarity for nuanced disinformation detection, tracing, and characterization. The tools developed in this thesis are hosted and can be accessed through the permission of the author. Please explain your use case in your request. The HTML friendly version of this paper is at https://chaytanc.github.io/projects/disinfo-research (Inman, 2025).
- Abstract(参考訳): この論文は、偽情報を検知し、その特徴であるニュアンス付き部分的真実を捉えるのに役立つ偽情報物語と類似性の連続的な尺度を発達させる。
そのため、2つのツールが開発され、その方法論が文書化されている。
トレースツールは、ツイートとターゲットのナラティブを取り込み、それぞれの類似性をターゲットのナラティブに評価し、タイムラインとしてグラフ化する。
第2のナラティブ合成ツールは、ツィートを類似性のしきい値の上にクラスタし、各クラスタ内で支配的なナラティブを生成する。
これらのツールは、Tweet Narrative Analysis Dashboardに統合される。
トレースツールはGLUE STS-Bベンチマークで検証され、2つのツールを使用して2つのケーススタディを分析し、さらなる実証的な検証を行う。
最初のケーススタディでは、「2020年の選挙が盗まれた」というターゲットの物語を使い、2020年のドナルド・トランプのツイートのデータセットを分析している。
第2のケーススタディでは、「トランスジェンダーの人々は社会に有害」という目標の物語を使い、The New York Times、The Guardian、The Gateway Pundit、Fox Newsなどのメディアから何万ものツイートを分析している。
これらのケーススタディから得られた経験的知見は、ニュアンス付き偽情報の検出、追跡、特徴付けのセマンティックな類似性を示すものである。
この論文で開発されたツールはホストされており、著者の許可を得てアクセスすることができる。
ご希望の件についてご説明下さい。
この論文のHTMLフレンドリー版はhttps://chaytanc.github.io/projects/disinfo-research (Inman, 2025)にある。
関連論文リスト
- NarrationDep: Narratives on Social Media For Automatic Depression Detection [24.11420537250414]
我々は、抑うつに関連する物語を検出することに焦点を当てた、textttNarrationDepと呼ばれる新しいモデルを開発した。
textttNarrationDepは、個々のツイート表現とユーザのツイートのクラスタを共同でモデル化するディープラーニングフレームワークである。
論文 参考訳(メタデータ) (2024-07-24T11:24:25Z) - Discovering collective narratives shifts in online discussions [3.6231158294409482]
本稿では,変化点検出,意味的役割ラベリング(SRL),物語の断片を物語ネットワークに自動集約することで,ギャップを埋める体系的な物語発見フレームワークを提案する。
我々は、新型コロナウイルスと2017年のフランス大統領選に関する2つのTwitterコーパスを合成および実証データで評価した。
以上の結果から,本手法は主要な出来事に対応する大きな物語シフトを回復できることが示された。
論文 参考訳(メタデータ) (2023-07-17T15:00:04Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Generalizing Hate Speech Detection Using Multi-Task Learning: A Case Study of Political Public Figures [3.825159708387601]
本研究では,複数のヘイトスピーチデータセットを同時に学習するマルチタスク学習パイプラインを提案する。
列車-テスト分割における一般化誤差を調べる際には強い結果が得られ、これまで見つからなかったデータセットの予測では大幅に改善された。
論文 参考訳(メタデータ) (2022-08-22T21:13:38Z) - Rumor Detection with Self-supervised Learning on Texts and Social Graph [101.94546286960642]
異種情報ソース上での自己教師型学習を対照的に提案し,それらの関係を明らかにするとともに,噂をよりよく特徴付ける。
我々はこの枠組みをSRD(Self-supervised Rumor Detection)と呼ぶ。
3つの実世界のデータセットに対する大規模な実験により、ソーシャルメディア上での噂の自動検出におけるSRDの有効性が検証された。
論文 参考訳(メタデータ) (2022-04-19T12:10:03Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - What goes on inside rumour and non-rumour tweets and their reactions: A
Psycholinguistic Analyses [58.75684238003408]
ソーシャルメディアのテキストの心理言語学的分析は、誤情報を緩和するために意味のある結論を導くのに不可欠である。
本研究は,様々な事象に関する噂の深い心理言語学的分析を行うことによって貢献する。
論文 参考訳(メタデータ) (2021-11-09T07:45:11Z) - Towards A Sentiment Analyzer for Low-Resource Languages [0.0]
本研究は,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的としている。
2019年のインドネシア大統領選挙で話題になったハッシュタグのtextit#kpujangancurangを使っています。
本研究は,ラピッドマイニングツールを用いて,Twitterデータを生成し,Nieve Bayes,K-Nearest Neighbor,Decision Tree,Multi-Layer Perceptronの分類手法を比較し,Twitterデータの感情を分類する。
論文 参考訳(メタデータ) (2020-11-12T13:50:00Z) - Sentiment Analysis on Social Media Content [0.0]
本研究の目的は,Twitterから収集した実データの感情分析を行うモデルを提案することである。
Twitterのデータは非常に非構造化されており、分析が困難である。
提案手法は,教師付き機械学習アルゴリズムと教師なし機械学習アルゴリズムの併用により,この分野の先行研究とは異なる。
論文 参考訳(メタデータ) (2020-07-04T17:03:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。