論文の概要: NELA-GT-2019: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles
- arxiv url: http://arxiv.org/abs/2003.08444v2
- Date: Thu, 26 Mar 2020 21:29:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-28 20:06:29.969172
- Title: NELA-GT-2019: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles
- Title(参考訳): NELA-GT-2019:ニュース記事における誤情報研究のための大規模マルチラベルニュースデータセット
- Authors: Maur\'icio Gruppi and Benjamin D. Horne and Sibel Adal{\i}
- Abstract要約: NELA-GT-2019には、2019年1月1日から12月31日までに収集された260件の情報源から112万件のニュース記事が掲載されている。
データセットには、複数の精度の次元をカバーする7つの異なるアセスメントサイトからのソースレベル基底真理ラベルが含まれている。
- 参考スコア(独自算出の注目度): 4.163860911052052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present an updated version of the NELA-GT-2018 dataset
(N{\o}rregaard, Horne, and Adal{\i} 2019), entitled NELA-GT-2019. NELA-GT-2019
contains 1.12M news articles from 260 sources collected between January 1st
2019 and December 31st 2019. Just as with NELA-GT-2018, these sources come from
a wide range of mainstream news sources and alternative news sources. Included
with the dataset are source-level ground truth labels from 7 different
assessment sites covering multiple dimensions of veracity. The NELA-GT-2019
dataset can be found at: https://doi.org/10.7910/DVN/O7FWPO
- Abstract(参考訳): 本稿では,NELA-GT-2018データセット(N{\o}rregaard,Horne,Adal{\i} 2019)の更新版について述べる。
nela-gt-2019には、2019年1月1日から12月31日までに収集された260のソースから12万件のニュース記事が含まれている。
nela-gt-2018と同様に、これらの情報源は幅広い主流のニュースソースと代替ニュースソースから来ている。
データセットには、複数の精度の次元をカバーする7つの異なるアセスメントサイトからのソースレベル基底真理ラベルが含まれている。
NELA-GT-2019データセットは、https://doi.org/10.7910/DVN/O7FWPOで見ることができる。
関連論文リスト
- Towards Corpus-Scale Discovery of Selection Biases in News Coverage:
Comparing What Sources Say About Entities as a Start [65.28355014154549]
本稿では,大規模ニュースコーパスにおけるニュースコンテンツから直接メディア選択バイアスのパターンを発見するために,スケーラブルなNLPシステムを構築する上での課題について検討する。
我々は,世界519のニュースソースから180万件のニュース記事のコーパスであるNELA-2020のケーススタディを通じて,フレームワークの能力を示す。
論文 参考訳(メタデータ) (2023-04-06T23:36:45Z) - TGDataset: a Collection of Over One Hundred Thousand Telegram Channels [69.22187804798162]
本稿では,120,979のTelegramチャネルと4億以上のメッセージを含む新しいデータセットであるTGDatasetを提案する。
我々は、データセット内で話される言語と、英語チャンネルでカバーされるトピックを分析した。
生のデータセットに加えて、データセットの分析に使用したスクリプトと、Sabmykと呼ばれる新しい陰謀論のネットワークに属するチャネルのリストもリリースしました。
論文 参考訳(メタデータ) (2023-03-09T15:42:38Z) - CovidMis20: COVID-19 Misinformation Detection System on Twitter Tweets
using Deep Learning Models [1.4085013201980032]
この研究は、2020年2月から7月にかけて収集された1,375,592ツイートからなるCovidMis20データセット(COVID-19 Misinformation 2020データセット)を提示する。
本研究は,Bi-LSTM深層学習とCNN+Bi-GRUを用いてフェイクニュースの検出を行った。
論文 参考訳(メタデータ) (2022-09-13T00:43:44Z) - NeuS: Neutral Multi-News Summarization for Mitigating Framing Bias [54.89737992911079]
様々な政治スペクトルの複数のニュース見出しから中立的な要約を生成する新しい課題を提案する。
最も興味深い観察の1つは、生成モデルは、事実的に不正確なコンテンツや検証不可能なコンテンツだけでなく、政治的に偏ったコンテンツにも幻覚を与えることができることである。
論文 参考訳(メタデータ) (2022-04-11T07:06:01Z) - NELA-GT-2021: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles [4.163860911052052]
データセットには、2021年1月1日から12月31日までの367のアウトレットからの1.8万記事が含まれている。
データセットの過去のリリースと同じように、NELA-GT-2021にはMedia Bias/Fact Checkのアウトレットレベルの検証ラベルと、収集されたニュース記事に埋め込まれたツイートが含まれている。
論文 参考訳(メタデータ) (2022-03-10T21:58:33Z) - NELA-GT-2020: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles [4.163860911052052]
NELA-GT-2020には、2020年1月1日から12月31日までに収集された519の情報源から、約1.8万件のニュース記事が掲載されている。
データセットに含まれるのは、Media Bias/Fact Check (MBFC) のソースレベル基底真理ラベルで、複数の精度の次元をカバーしている。
論文 参考訳(メタデータ) (2021-02-08T22:55:37Z) - Viable Threat on News Reading: Generating Biased News Using Natural
Language Models [49.90665530780664]
公開されている言語モデルは、入力されたオリジナルニュースに基づいてバイアスのあるニュースコンテンツを確実に生成できることを示す。
また、制御可能なテキスト生成を用いて、多数の高品質な偏りのあるニュース記事を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-05T16:55:39Z) - 365 Dots in 2019: Quantifying Attention of News Sources [69.50862982117125]
様々な情報源から,オンラインニュース記事の話題の重複を計測する。
ほぼリアルタイムで注目度に応じてニュースストーリーを採点する。
これにより、最も注目を集めているトピックを識別するなど、複数の研究が可能になる。
論文 参考訳(メタデータ) (2020-03-22T20:32:47Z) - HoaxItaly: a collection of Italian disinformation and fact-checking
stories shared on Twitter in 2019 [72.96986027203377]
データセットには約37Kのニュース記事のタイトルとボディも含まれている。
https://doi.org/10.79DVN/PGVDHXで公開されている。
論文 参考訳(メタデータ) (2020-01-29T16:14:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。