Fugu-MT 論文翻訳(概要): Analyzing the Influence of Fake News in the 2024 Elections: A Comprehensive Dataset

論文の概要: Analyzing the Influence of Fake News in the 2024 Elections: A Comprehensive Dataset

arxiv url: http://arxiv.org/abs/2312.03750v1
Date: Fri, 1 Dec 2023 20:14:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-11 02:57:34.101372
Title: Analyzing the Influence of Fake News in the 2024 Elections: A Comprehensive Dataset
Title（参考訳）: 2024年の選挙における偽ニュースの影響分析:包括的データセット
Authors: Mizanur Rahman and Shaina Raza
Abstract要約: この研究は、米国の政治演説におけるフェイクニュースに焦点を当てたデータセットを導入し、特に人種的偏見と偏見を調べている。 4万件のニュース記事のスクレイピングと注釈付け,高度なNLPツールと人間による検証により,政治談話における誤情報に関する微妙な理解を提供する。
参考スコア（独自算出の注目度）: 8.50235442993206
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: This work introduces a dataset focused on fake news in US political speeches, specifically examining racial slurs and biases. By scraping and annotating 40,000 news articles, using advanced NLP tools and human verification, we provide a nuanced understanding of misinformation in political discourse. The dataset, designed for machine learning and bias analysis, is a critical resource for researchers, policymakers, and educators. It facilitates the development of strategies against misinformation and enhances media literacy, marking a significant contribution to the study of fake news and political communication. Our dataset, focusing on the analysis of fake news in the context of the 2024 elections, is publicly accessible for community to work on fake news identification. Our dataset, focusing on the analysis of fake news in the context of the 2024 elections, is publicly accessible.
Abstract（参考訳）: この研究は、米国の政治演説におけるフェイクニュースに焦点を当てたデータセットを紹介します。 4万件のニュース記事のスクレイピングと注釈付け,高度なNLPツールと人間による検証により,政治談話における誤情報に関する微妙な理解を提供する。機械学習とバイアス分析のために設計されたデータセットは、研究者、政策立案者、教育者にとって重要なリソースである。偽情報に対する戦略の発展を促進し、メディアのリテラシーを高め、偽ニュースや政治コミュニケーションの研究に重要な貢献をした。 2024年の選挙の文脈におけるフェイクニュースの分析に焦点をあてたデータセットは、コミュニティがフェイクニュースの識別に取り組まなければならない。 2024年の選挙の文脈におけるフェイクニュースの分析に焦点を当てたデータセットが公開されている。

関連論文リスト

Bridging the Data Provenance Gap Across Text, Speech and Video [67.72097952282262]
我々は、人気テキスト、音声、ビデオデータセットのモダリティにまたがって、最大かつ第1級の経時的監査を行う。私たちの手動分析では、1990年から2024年の間に、608言語、798のソース、659の組織、67の国で4000近い公開データセットをカバーしています。マルチモーダル機械学習アプリケーションは、トレーニングセットのために、YouTubeのようなWebcrawled、synthetic、ソーシャルメディアプラットフォームに圧倒的に移行した。
論文参考訳（メタデータ） (2024-12-19T01:30:19Z)
Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文参考訳（メタデータ） (2024-06-20T16:34:07Z)
EUvsDisinfo: A Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles [4.895830603263421]
この研究は、EUvsDisinfoという、プロクレムリンアウトレットから派生した偽情報の多言語データセットを紹介している。 EUvsDisinfoプロジェクトのリーダーである専門家によって書かれたデバンク記事から直接引用されている。我々のデータセットは、記事の総数と異なる言語に関して、これまでで最大のリソースです。
論文参考訳（メタデータ） (2024-06-18T13:43:22Z)
Open the Data! Chuvash Datasets [50.59120569845975]
Chuvash言語用の包括的データセットを4つ紹介する。これらのデータセットには、モノリンガルデータセット、ロシア語による並列データセット、英語による並列データセット、オーディオデータセットが含まれる。
論文参考訳（メタデータ） (2024-05-31T07:51:19Z)
A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文参考訳（メタデータ） (2024-02-26T18:54:35Z)
SEPSIS: I Can Catch Your Lies -- A New Paradigm for Deception Detection [9.20397189600732]
本研究は, 心理学のレンズを通して, 騙しの問題を探究するものである。そこで本研究では,NLP技術を利用した偽造検出のための新しいフレームワークを提案する。我々は、微調整言語モデルのデータレスマージを利用した、新しいマルチタスク学習パイプラインを提案する。
論文参考訳（メタデータ） (2023-12-01T02:13:25Z)
When a Language Question Is at Stake. A Revisited Approach to Label Sensitive Content [0.0]
記事では、ロシアとウクライナの戦争を取り上げたウクライナのツイートの例について、疑似ラベル付き機密データのアプローチを再検討する。得られたデータを統計的に解析し、擬似ラベリングに使用するモデルの評価を行い、さらにそのコーパスの活用方法についてのガイドラインを定めている。
論文参考訳（メタデータ） (2023-11-17T13:35:10Z)
Deepfake audio as a data augmentation technique for training automatic speech to text transcription models [55.2480439325792]
本稿では,ディープフェイク音声に基づくデータ拡張手法を提案する。インド人(英語)が生成したデータセットが選択され、単一のアクセントの存在が保証された。
論文参考訳（メタデータ） (2023-09-22T11:33:03Z)
NusaWrites: Constructing High-Quality Corpora for Underrepresented and Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文参考訳（メタデータ） (2023-09-19T14:42:33Z)
Uncovering Political Hate Speech During Indian Election Campaign: A New Low-Resource Dataset and Baselines [3.3228144010758593]
IEHateデータセットには、2021年11月1日から2022年3月9日までのインド議会選挙に関連する11,457件のヒンディー語ツイートが含まれている。機械学習、ディープラーニング、トランスフォーマーベースのアルゴリズムを用いてデータセットをベンチマークする。特に、アルゴリズムよりも人間評価のスコアが比較的高いことは、効果的なヘイトスピーチのモデレーションに人間と自動化の両方のアプローチを活用することの重要性を強調している。
論文参考訳（メタデータ） (2023-06-26T15:17:54Z)
Identifying Informational Sources in News Articles [109.70475599552523]
我々は、ニュース執筆に使用される情報ソースの、最大かつ最も広範囲にアノテートされたデータセットを構築した。本稿では,ニュース記事中のソースの構成性を研究するための新しいタスクであるソース予測を導入する。
論文参考訳（メタデータ） (2023-05-24T08:56:35Z)
Mitigation of Diachronic Bias in Fake News Detection Dataset [3.2800968305157205]
フェイクニュースデータセットのほとんどは、特定の期間に依存する。このようなデータセットでトレーニングされた検出モデルは、政治的変化や社会的変化によって生じる新しい偽ニュースを検出するのに困難である。ウィキデータを用いたマスキング手法を提案し、人物名の影響を緩和し、偽ニュース検出モデルを堅牢にしているかどうかを検証する。
論文参考訳（メタデータ） (2021-08-28T08:25:29Z)
An open access NLP dataset for Arabic dialects : Data collection, labeling, and model construction [0.8312466807725921]
いくつかのアラビア方言でソーシャルデータの内容のオープンデータセットを提示する。このデータはTwitterのソーシャルネットワークから収集され、5つの国語で+50K twitsで構成されています。このデータをオープンアクセスデータとして公開し,イノベーションを奨励し,アラビア語方言やソーシャルメディアのnlp分野の著作を奨励する。
論文参考訳（メタデータ） (2021-02-07T01:39:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。