論文の概要: Analyzing the Influence of Fake News in the 2024 Elections: A
Comprehensive Dataset
- arxiv url: http://arxiv.org/abs/2312.03750v1
- Date: Fri, 1 Dec 2023 20:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 02:57:34.101372
- Title: Analyzing the Influence of Fake News in the 2024 Elections: A
Comprehensive Dataset
- Title(参考訳): 2024年の選挙における偽ニュースの影響分析:包括的データセット
- Authors: Mizanur Rahman and Shaina Raza
- Abstract要約: この研究は、米国の政治演説におけるフェイクニュースに焦点を当てたデータセットを導入し、特に人種的偏見と偏見を調べている。
4万件のニュース記事のスクレイピングと注釈付け,高度なNLPツールと人間による検証により,政治談話における誤情報に関する微妙な理解を提供する。
- 参考スコア(独自算出の注目度): 8.50235442993206
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work introduces a dataset focused on fake news in US political speeches,
specifically examining racial slurs and biases. By scraping and annotating
40,000 news articles, using advanced NLP tools and human verification, we
provide a nuanced understanding of misinformation in political discourse. The
dataset, designed for machine learning and bias analysis, is a critical
resource for researchers, policymakers, and educators. It facilitates the
development of strategies against misinformation and enhances media literacy,
marking a significant contribution to the study of fake news and political
communication. Our dataset, focusing on the analysis of fake news in the
context of the 2024 elections, is publicly accessible for community to work on
fake news identification. Our dataset, focusing on the analysis of fake news in
the context of the 2024 elections, is publicly accessible.
- Abstract(参考訳): この研究は、米国の政治演説におけるフェイクニュースに焦点を当てたデータセットを紹介します。
4万件のニュース記事のスクレイピングと注釈付け,高度なNLPツールと人間による検証により,政治談話における誤情報に関する微妙な理解を提供する。
機械学習とバイアス分析のために設計されたデータセットは、研究者、政策立案者、教育者にとって重要なリソースである。
偽情報に対する戦略の発展を促進し、メディアのリテラシーを高め、偽ニュースや政治コミュニケーションの研究に重要な貢献をした。
2024年の選挙の文脈におけるフェイクニュースの分析に焦点をあてたデータセットは、コミュニティがフェイクニュースの識別に取り組まなければならない。
2024年の選挙の文脈におけるフェイクニュースの分析に焦点を当てたデータセットが公開されている。
関連論文リスト
- Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - EUvsDisinfo: A Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles [4.895830603263421]
この研究は、EUvsDisinfoという、プロクレムリンアウトレットから派生した偽情報の多言語データセットを紹介している。
EUvsDisinfoプロジェクトのリーダーである専門家によって書かれたデバンク記事から直接引用されている。
我々のデータセットは、記事の総数と異なる言語に関して、これまでで最大のリソースです。
論文 参考訳(メタデータ) (2024-06-18T13:43:22Z) - Open the Data! Chuvash Datasets [50.59120569845975]
Chuvash言語用の包括的データセットを4つ紹介する。
これらのデータセットには、モノリンガルデータセット、ロシア語による並列データセット、英語による並列データセット、オーディオデータセットが含まれる。
論文 参考訳(メタデータ) (2024-05-31T07:51:19Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - SEPSIS: I Can Catch Your Lies -- A New Paradigm for Deception Detection [9.20397189600732]
本研究は, 心理学のレンズを通して, 騙しの問題を探究するものである。
そこで本研究では,NLP技術を利用した偽造検出のための新しいフレームワークを提案する。
我々は、微調整言語モデルのデータレスマージを利用した、新しいマルチタスク学習パイプラインを提案する。
論文 参考訳(メタデータ) (2023-12-01T02:13:25Z) - When a Language Question Is at Stake. A Revisited Approach to Label
Sensitive Content [0.0]
記事では、ロシアとウクライナの戦争を取り上げたウクライナのツイートの例について、疑似ラベル付き機密データのアプローチを再検討する。
得られたデータを統計的に解析し、擬似ラベリングに使用するモデルの評価を行い、さらにそのコーパスの活用方法についてのガイドラインを定めている。
論文 参考訳(メタデータ) (2023-11-17T13:35:10Z) - Deepfake audio as a data augmentation technique for training automatic
speech to text transcription models [55.2480439325792]
本稿では,ディープフェイク音声に基づくデータ拡張手法を提案する。
インド人(英語)が生成したデータセットが選択され、単一のアクセントの存在が保証された。
論文 参考訳(メタデータ) (2023-09-22T11:33:03Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Identifying Informational Sources in News Articles [109.70475599552523]
我々は、ニュース執筆に使用される情報ソースの、最大かつ最も広範囲にアノテートされたデータセットを構築した。
本稿では,ニュース記事中のソースの構成性を研究するための新しいタスクであるソース予測を導入する。
論文 参考訳(メタデータ) (2023-05-24T08:56:35Z) - Mitigation of Diachronic Bias in Fake News Detection Dataset [3.2800968305157205]
フェイクニュースデータセットのほとんどは、特定の期間に依存する。
このようなデータセットでトレーニングされた検出モデルは、政治的変化や社会的変化によって生じる新しい偽ニュースを検出するのに困難である。
ウィキデータを用いたマスキング手法を提案し、人物名の影響を緩和し、偽ニュース検出モデルを堅牢にしているかどうかを検証する。
論文 参考訳(メタデータ) (2021-08-28T08:25:29Z) - An open access NLP dataset for Arabic dialects : Data collection,
labeling, and model construction [0.8312466807725921]
いくつかのアラビア方言でソーシャルデータの内容のオープンデータセットを提示する。
このデータはTwitterのソーシャルネットワークから収集され、5つの国語で+50K twitsで構成されています。
このデータをオープンアクセスデータとして公開し,イノベーションを奨励し,アラビア語方言やソーシャルメディアのnlp分野の著作を奨励する。
論文 参考訳(メタデータ) (2021-02-07T01:39:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。