論文の概要: NELA-Local: A Dataset of U.S. Local News Articles for the Study of
County-level News Ecosystems
- arxiv url: http://arxiv.org/abs/2203.08600v1
- Date: Wed, 16 Mar 2022 13:19:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 15:40:44.860964
- Title: NELA-Local: A Dataset of U.S. Local News Articles for the Study of
County-level News Ecosystems
- Title(参考訳): nela-local: 郡レベルのニュースエコシステム研究のための米国ローカルニュース記事のデータセット
- Authors: Benjamin D. Horne, Maur\'icio Gruppi, Kenneth Joseph, Jon Green, John
P. Wihbey, and Sibel Adal{\i}
- Abstract要約: 地元313社のオンラインニュース記事14万件以上のデータセットを提示する。
これらのアウトレットは地理的に多様な地域社会をカバーしている。
- 参考スコア(独自算出の注目度): 4.977804197346136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a dataset of over 1.4M online news articles from
313 local U.S. news outlets published over 20 months (between April 4th, 2020
and December 31st, 2021). These outlets cover a geographically diverse set of
communities across the United States. In order to estimate characteristics of
the local audience, included with this news article data is a wide range of
county-level metadata, including demographics, 2020 Presidential Election vote
shares, and community resilience estimates from the U.S. Census Bureau. The
NELA-Local dataset can be found at:
https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/GFE66K.
- Abstract(参考訳): 本稿では,20ヶ月以上にわたって発行された313の地域ニュースサイト(2020年4月4日~2021年12月31日)から,140万以上のオンラインニュース記事のデータセットを提案する。
これらの出口は全米の地理的に多様な地域社会をカバーしている。
地域住民の特徴を推定するために、このニュース記事に含まれるデータは、人口統計、2020年の大統領選挙の投票シェア、アメリカ合衆国国勢調査局からのコミュニティ・レジリエンス推定など、幅広い郡レベルのメタデータである。
NELA-Localデータセットは、https://dataverse.harvard.edu/dataset.xhtml?
persistentId=doi:10.7910/DVN/GFE66K
関連論文リスト
- 3DLNews: A Three-decade Dataset of US Local News Articles [49.1574468325115]
3DLNewsは、1996年から2024年までの期間にアメリカのローカルニュース記事を載せた、新しいデータセットである。
約100万のURL(HTMLテキストを含む)があり、50州で14,000以上の地元新聞、テレビ、ラジオ局から提供されている。
論文 参考訳(メタデータ) (2024-08-08T18:33:37Z) - Analyzing the Impact of Fake News on the Anticipated Outcome of the 2024
Election Ahead of Time [7.1970442944315245]
フェイクニュースに関する認識と研究の高まりにもかかわらず、北米の政治演説の中で人種的スラリーや偏見を特にターゲットとするデータセットは、依然として大きな必要性がある。
本研究では、これらの誤情報の重要な側面を照らす包括的データセットを紹介する。
論文 参考訳(メタデータ) (2023-12-01T20:14:16Z) - Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文 参考訳(メタデータ) (2022-10-26T02:25:23Z) - News Category Dataset [1.7513645771137178]
HuffPostから入手した2012年から2018年までの約200万のニュースの見出しを含むNews Categoryデータセットを提示する。
本稿では,データセットから新たな知見を導き,データセットの既存および潜在的応用について述べる。
論文 参考訳(メタデータ) (2022-09-23T06:13:16Z) - Datasets: A Community Library for Natural Language Processing [55.48866401721244]
データセットは、現代のNLPのためのコミュニティライブラリである。
このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
論文 参考訳(メタデータ) (2021-09-07T03:59:22Z) - Counting Protests in News Articles: A Dataset and Semi-Automated Data
Collection Pipeline [0.0]
2017年1月から2021年1月にかけて、米国の何千もの地元メディアが、市民権、移民、銃、環境などに関する42,000以上の抗議活動について報告した。
われわれは、2017年1月から2021年1月までに米国で報告された42,347の抗議イベントに対応する、ニュース記事URL、日付、場所、人口規模の推定値、および494の個別記述タグのデータセットを公表した。
論文 参考訳(メタデータ) (2021-02-01T15:35:21Z) - CovidNet: To Bring Data Transparency in the Era of COVID-19 [9.808021836153712]
本稿では,大規模流行データセットに関連付けられた新型コロナウイルス追跡プロジェクトであるCovidNetについて述べる。
CovidNetは、世界27か国から4,124のサブディビジョンのリアルタイムグローバルケース情報を提供する唯一のプラットフォームである。
データセットの正確性と鮮度は、自発的なチームワーク、クラウドソーシングチャネル、自動データパイプラインによる苦労の結果です。
論文 参考訳(メタデータ) (2020-05-22T00:05:17Z) - 365 Dots in 2019: Quantifying Attention of News Sources [69.50862982117125]
様々な情報源から,オンラインニュース記事の話題の重複を計測する。
ほぼリアルタイムで注目度に応じてニュースストーリーを採点する。
これにより、最も注目を集めているトピックを識別するなど、複数の研究が可能になる。
論文 参考訳(メタデータ) (2020-03-22T20:32:47Z) - NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。
他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。
本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文 参考訳(メタデータ) (2020-01-10T09:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。