論文の概要: NELA-GT-2021: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles
- arxiv url: http://arxiv.org/abs/2203.05659v1
- Date: Thu, 10 Mar 2022 21:58:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-14 12:19:36.393878
- Title: NELA-GT-2021: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles
- Title(参考訳): NELA-GT-2021:ニュース記事における誤情報研究のための大規模マルチラベルニュースデータセット
- Authors: Maur\'icio Gruppi, Benjamin D. Horne, Sibel Adal{\i}
- Abstract要約: データセットには、2021年1月1日から12月31日までの367のアウトレットからの1.8万記事が含まれている。
データセットの過去のリリースと同じように、NELA-GT-2021にはMedia Bias/Fact Checkのアウトレットレベルの検証ラベルと、収集されたニュース記事に埋め込まれたツイートが含まれている。
- 参考スコア(独自算出の注目度): 4.163860911052052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present the fourth installment of the NELA-GT datasets,
NELA-GT-2021. The dataset contains 1.8M articles from 367 outlets between
January 1st, 2021 and December 31st, 2021. Just as in past releases of the
dataset, NELA-GT-2021 includes outlet-level veracity labels from Media
Bias/Fact Check and tweets embedded in collected news articles. The
NELA-GT-2021 dataset can be found at: https://doi.org/10.7910/DVN/RBKVBM
- Abstract(参考訳): 本稿では,NELA-GTデータセットNELA-GT-2021の4番目のインストールについて述べる。
データセットには、2021年1月1日から12月31日までの367のアウトレットからの1.8万記事が含まれている。
データセットの過去のリリースと同じように、NELA-GT-2021にはMedia Bias/Fact Checkのアウトレットレベルの検証ラベルと、収集されたニュース記事に埋め込まれたツイートが含まれている。
NELA-GT-2021データセットは、https://doi.org/10.7910/DVN/RBKVBMで見ることができる。
関連論文リスト
- 3DLNews: A Three-decade Dataset of US Local News Articles [49.1574468325115]
3DLNewsは、1996年から2024年までの期間にアメリカのローカルニュース記事を載せた、新しいデータセットである。
約100万のURL(HTMLテキストを含む)があり、50州で14,000以上の地元新聞、テレビ、ラジオ局から提供されている。
論文 参考訳(メタデータ) (2024-08-08T18:33:37Z) - A diverse Multilingual News Headlines Dataset from around the World [57.37355895609648]
Babel Briefingsは、2020年8月から2021年11月までの470万のニュースの見出しを、世界中の30の言語と54の場所にわたって掲載した、新しいデータセットである。
言語モデルのトレーニングや評価のための高品質なデータセットとして機能し、単純でアクセスしやすい記事のコレクションを提供する。
論文 参考訳(メタデータ) (2024-03-28T12:08:39Z) - MN-DS: A Multilabeled News Dataset for News Articles Hierarchical
Classification [0.0]
この記事では、2019年1月1日から12月31日までに収集された階層的なニュースカテゴリを持つ10,917のニュース記事のデータセットを示す。
記事は17の第一級と109の第二級の階層的な分類に基づいて手動でラベル付けした。
このデータセットは、トピック毎にニュース記事を自動的に分類するマシンラーニングモデルをトレーニングするために使用することができる。
論文 参考訳(メタデータ) (2022-12-22T22:27:26Z) - CovidMis20: COVID-19 Misinformation Detection System on Twitter Tweets
using Deep Learning Models [1.4085013201980032]
この研究は、2020年2月から7月にかけて収集された1,375,592ツイートからなるCovidMis20データセット(COVID-19 Misinformation 2020データセット)を提示する。
本研究は,Bi-LSTM深層学習とCNN+Bi-GRUを用いてフェイクニュースの検出を行った。
論文 参考訳(メタデータ) (2022-09-13T00:43:44Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2021 [55.41644538483948]
共有タスクの目標は、コミュニティにこの重要な問題を解決するための効率的な方法を考え出すことを動機付けることです。
トレーニングセットには1300件の注釈付きニュース記事、750件のリアルニュース、550件のフェイクニュース、300件のニュース記事、200件のリアルニュース、100件のフェイクニュースが含まれている。
F1-macroスコアは0.679で、これは過去最高の0.907 F1-macroよりも低かった。
論文 参考訳(メタデータ) (2022-07-11T18:58:36Z) - NELA-Local: A Dataset of U.S. Local News Articles for the Study of
County-level News Ecosystems [4.977804197346136]
地元313社のオンラインニュース記事14万件以上のデータセットを提示する。
これらのアウトレットは地理的に多様な地域社会をカバーしている。
論文 参考訳(メタデータ) (2022-03-16T13:19:21Z) - Webly Supervised Fine-Grained Recognition: Benchmark Datasets and An
Approach [115.91099791629104]
WebFG-496 と WebiNat-5089 の2つの新しいベンチマークを構築した。
WebiNat-5089には5089のサブカテゴリと1100万以上のWebトレーニングイメージが含まれている。
そこで本研究では,これらのデータセットのベンチマークを行うための新しいウェブ教師付き手法("Peer-learning'" と呼ぶ)を提案する。
論文 参考訳(メタデータ) (2021-08-05T06:28:32Z) - NELA-GT-2020: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles [4.163860911052052]
NELA-GT-2020には、2020年1月1日から12月31日までに収集された519の情報源から、約1.8万件のニュース記事が掲載されている。
データセットに含まれるのは、Media Bias/Fact Check (MBFC) のソースレベル基底真理ラベルで、複数の精度の次元をカバーしている。
論文 参考訳(メタデータ) (2021-02-08T22:55:37Z) - 365 Dots in 2019: Quantifying Attention of News Sources [69.50862982117125]
様々な情報源から,オンラインニュース記事の話題の重複を計測する。
ほぼリアルタイムで注目度に応じてニュースストーリーを採点する。
これにより、最も注目を集めているトピックを識別するなど、複数の研究が可能になる。
論文 参考訳(メタデータ) (2020-03-22T20:32:47Z) - NELA-GT-2019: A Large Multi-Labelled News Dataset for The Study of
Misinformation in News Articles [4.163860911052052]
NELA-GT-2019には、2019年1月1日から12月31日までに収集された260件の情報源から112万件のニュース記事が掲載されている。
データセットには、複数の精度の次元をカバーする7つの異なるアセスメントサイトからのソースレベル基底真理ラベルが含まれている。
論文 参考訳(メタデータ) (2020-03-18T19:18:21Z) - HoaxItaly: a collection of Italian disinformation and fact-checking
stories shared on Twitter in 2019 [72.96986027203377]
データセットには約37Kのニュース記事のタイトルとボディも含まれている。
https://doi.org/10.79DVN/PGVDHXで公開されている。
論文 参考訳(メタデータ) (2020-01-29T16:14:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。