論文の概要: Divergent Emotional Patterns in Disinformation on Social Media? An Analysis of Tweets and TikToks about the DANA in Valencia
- arxiv url: http://arxiv.org/abs/2501.18640v1
- Date: Tue, 28 Jan 2025 17:50:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 14:03:42.671044
- Title: Divergent Emotional Patterns in Disinformation on Social Media? An Analysis of Tweets and TikToks about the DANA in Valencia
- Title(参考訳): ソーシャルメディアにおける偽情報における多様な感情パターン : バレンシアにおけるDANAに関するつぶやきとTikToksの分析
- Authors: Iván Arcos, Paolo Rosso, Ramón Salaverría,
- Abstract要約: 本研究では,2024年スペインにおけるDANAイベントにおけるソーシャルメディアプラットフォーム上での偽情報の拡散について検討した。
我々は、650のTikTokとXの投稿からなる新しいデータセットを作成しました。
感情分析の結果、X上の偽情報は主に悲しみと恐怖の増大と関連していることがわかったが、TikTokでは怒りと嫌悪のレベルが高かった。
- 参考スコア(独自算出の注目度): 5.289887473031932
- License:
- Abstract: This study investigates the dissemination of disinformation on social media platforms during the DANA event (DANA is a Spanish acronym for Depresion Aislada en Niveles Altos, translating to high-altitude isolated depression) that resulted in extremely heavy rainfall and devastating floods in Valencia, Spain, on October 29, 2024. We created a novel dataset of 650 TikTok and X posts, which was manually annotated to differentiate between disinformation and trustworthy content. Additionally, a Few-Shot annotation approach with GPT-4o achieved substantial agreement (Cohen's kappa of 0.684) with manual labels. Emotion analysis revealed that disinformation on X is mainly associated with increased sadness and fear, while on TikTok, it correlates with higher levels of anger and disgust. Linguistic analysis using the LIWC dictionary showed that trustworthy content utilizes more articulate and factual language, whereas disinformation employs negations, perceptual words, and personal anecdotes to appear credible. Audio analysis of TikTok posts highlighted distinct patterns: trustworthy audios featured brighter tones and robotic or monotone narration, promoting clarity and credibility, while disinformation audios leveraged tonal variation, emotional depth, and manipulative musical elements to amplify engagement. In detection models, SVM+TF-IDF achieved the highest F1-Score, excelling with limited data. Incorporating audio features into roberta-large-bne improved both Accuracy and F1-Score, surpassing its text-only counterpart and SVM in Accuracy. GPT-4o Few-Shot also performed well, showcasing the potential of large language models for automated disinformation detection. These findings demonstrate the importance of leveraging both textual and audio features for improved disinformation detection on multimodal platforms like TikTok.
- Abstract(参考訳): 本研究は,2024年10月29日にスペイン・バレンシアで発生した豪雨と壊滅的な洪水を招いた,DANAイベント中のソーシャルメディアプラットフォーム上での偽情報の拡散について検討した。
我々は、650のTikTokとXの投稿からなる新しいデータセットを作成しました。
さらに、GPT-4oとFew-Shotアノテーションのアプローチは、手動ラベルとの相当な合意(コーエンのカッパ0.684)を達成した。
感情分析の結果、X上の偽情報は主に悲しみと恐怖の増大と関連していることがわかったが、TikTokでは怒りと嫌悪のレベルが高かった。
LIWC辞書を用いた言語分析では、信頼に値するコンテンツはより明瞭で事実的な言語を利用するのに対し、偽情報は否定、知覚的な言葉、個人的な逸話を信頼できるものとして採用している。
信頼できるオーディオは明るいトーンとロボティクス、モノトーンのナレーションを特徴とし、明瞭さと信頼性を促進し、偽情報オーディオは声調の変化、感情の深さ、操作的な音楽要素を活用してエンゲージメントを増幅した。
検出モデルでは、SVM+TF-IDFは、限られたデータで優れたF1スコアを達成した。
roberta-large-bneにオーディオ機能を組み込むことで、精度とF1-Scoreが向上し、テキストのみと精度のSVMを上回った。
GPT-4o Few-Shotも良好に動作し、自動偽情報検出のための大規模言語モデルの可能性を示した。
これらの結果は、TikTokのようなマルチモーダルプラットフォーム上での偽情報検出を改善するために、テキスト機能と音声機能の両方を活用することが重要であることを示している。
関連論文リスト
- A Preliminary Exploration with GPT-4o Voice Mode [42.17640770852045]
本報告では,GPT-4oを様々なタスクにわたって評価し,その音声処理と推論能力について分析する。
他の大型オーディオ言語モデル(LALM)よりも幻覚に対する堅牢性が高い。
GPT-4oの安全性メカニズムは、話者識別、年齢分類、MOS予測、オーディオディープフェイク検出などのタスクを減少させる。
論文 参考訳(メタデータ) (2025-02-14T06:34:08Z) - RideKE: Leveraging Low-Resource, User-Generated Twitter Content for Sentiment and Emotion Detection in Kenyan Code-Switched Dataset [4.142287865325998]
我々は、ケニアのコード変更データを分析し、感情分類と感情分類のための4つの最先端トランスフォーマー(SOTA)モデルを評価する。
感情分析では、XLM-Rは最高精度(69.2%)、F1スコア(66.1%)、XLM-R半教師(67.2%、64.1%)を達成する。
感情分析では、DistilBERTは精度59.8%、F1は31%、mBERTは半監督的(精度59%、F1は26.5)である。
論文 参考訳(メタデータ) (2025-02-10T06:18:07Z) - Text Injection for Neural Contextual Biasing [57.589903308622745]
本研究では文脈テキストインジェクション(CTI)を提案する。
1000億のテキストを持つCTIは、強い神経バイアスモデルから43.3%の相対的なWER削減を達成することができる。
論文 参考訳(メタデータ) (2024-06-05T04:20:17Z) - Cross-modality Data Augmentation for End-to-End Sign Language Translation [66.46877279084083]
エンドツーエンド手話翻訳(SLT)は、手話動画を中間表現なしで直接音声言語テキストに変換することを目的としている。
署名ビデオとテキスト間のモダリティのギャップとラベル付きデータの不足のため、これは難しい課題だった。
本稿では,強力な光沢からテキストへの翻訳機能をエンドツーエンドの手話翻訳に変換するための,新しいクロスモダリティデータ拡張(XmDA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-18T16:34:18Z) - Hate Speech and Offensive Language Detection using an Emotion-aware
Shared Encoder [1.8734449181723825]
ヘイトスピーチと攻撃的言語検出に関する既存の研究は、事前学習されたトランスフォーマーモデルに基づいて有望な結果をもたらす。
本稿では,他コーパスから抽出した外的感情特徴を組み合わせたマルチタスク共同学習手法を提案する。
以上の結果から,感情的な知識が,データセット間のヘイトスピーチや攻撃的言語をより確実に識別する上で有効であることが示唆された。
論文 参考訳(メタデータ) (2023-02-17T09:31:06Z) - Automatic Dialect Density Estimation for African American English [74.44807604000967]
アフリカ・アメリカン・イングリッシュ(AAE)方言の方言密度の自動予測について検討する。
方言密度は、非標準方言の特徴を含む発話における単語の割合として定義される。
このデータベースでは,AAE音声に対する予測された真理弁証密度と地上の真理弁証密度との間に有意な相関関係を示す。
論文 参考訳(メタデータ) (2022-04-03T01:34:48Z) - Towards Language Modelling in the Speech Domain Using Sub-word
Linguistic Units [56.52704348773307]
音節や音素を含む言語単位に基づくLSTMに基づく新しい生成音声LMを提案する。
限られたデータセットでは、現代の生成モデルで要求されるものよりも桁違いに小さいので、我々のモデルはバブリング音声を近似する。
補助的なテキストLM,マルチタスク学習目標,補助的な調音特徴を用いた訓練の効果を示す。
論文 参考訳(メタデータ) (2021-10-31T22:48:30Z) - VidLanKD: Improving Language Understanding via Video-Distilled Knowledge
Transfer [76.3906723777229]
言語理解を改善するためのビデオ言語知識蒸留法VidLanKDを提案する。
我々は、ビデオテキストデータセット上でマルチモーダル教師モデルを訓練し、その知識をテキストデータセットを用いて学生言語モデルに伝達する。
我々の実験では、VidLanKDはテキストのみの言語モデルや発声モデルよりも一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-07-06T15:41:32Z) - AraCOVID19-MFH: Arabic COVID-19 Multi-label Fake News and Hate Speech
Detection Dataset [0.0]
「AraCOVID19-MFH」は、アラビア・COVID-19の偽ニュースとヘイトスピーチ検出データセットを手動で注釈付けしたものである。
当社のデータセットには、10の異なるラベルで注釈付けされた10,828のアラビア語ツイートが含まれています。
ヘイトスピーチの検出、意見/ニュースの分類、方言の識別、その他多くのタスクにも使用できる。
論文 参考訳(メタデータ) (2021-05-07T09:52:44Z) - Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake
News Detection [7.29381091750894]
偽ニュース検出のためのトランスフォーマーに基づく言語モデルの微調整手法を提案する。
まず、個々のモデルのトークン語彙を専門用語の実際の意味論のために拡張する。
最後に、普遍言語モデルRoBERTaとドメイン固有モデルCT-BERTによって抽出された予測特徴を、複数の層認識によって融合させ、微細で高レベルな特定の表現を統合する。
論文 参考訳(メタデータ) (2021-01-14T09:05:42Z) - InfoBERT: Improving Robustness of Language Models from An Information
Theoretic Perspective [84.78604733927887]
BERTのような大規模言語モデルは、幅広いNLPタスクで最先端のパフォーマンスを実現している。
近年の研究では、このようなBERTベースのモデルが、テキストの敵対的攻撃の脅威に直面していることが示されている。
本稿では,事前学習した言語モデルの堅牢な微調整のための新しい学習フレームワークであるInfoBERTを提案する。
論文 参考訳(メタデータ) (2020-10-05T20:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。