Fugu-MT 論文翻訳(概要): NELA-Local: A Dataset of U.S. Local News Articles for the Study of County-level News Ecosystems

論文の概要: NELA-Local: A Dataset of U.S. Local News Articles for the Study of County-level News Ecosystems

arxiv url: http://arxiv.org/abs/2203.08600v1
Date: Wed, 16 Mar 2022 13:19:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-19 15:40:44.860964
Title: NELA-Local: A Dataset of U.S. Local News Articles for the Study of County-level News Ecosystems
Title（参考訳）: nela-local: 郡レベルのニュースエコシステム研究のための米国ローカルニュース記事のデータセット
Authors: Benjamin D. Horne, Maur\'icio Gruppi, Kenneth Joseph, Jon Green, John P. Wihbey, and Sibel Adal{\i}
Abstract要約: 地元313社のオンラインニュース記事14万件以上のデータセットを提示する。これらのアウトレットは地理的に多様な地域社会をカバーしている。
参考スコア（独自算出の注目度）: 4.977804197346136
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we present a dataset of over 1.4M online news articles from 313 local U.S. news outlets published over 20 months (between April 4th, 2020 and December 31st, 2021). These outlets cover a geographically diverse set of communities across the United States. In order to estimate characteristics of the local audience, included with this news article data is a wide range of county-level metadata, including demographics, 2020 Presidential Election vote shares, and community resilience estimates from the U.S. Census Bureau. The NELA-Local dataset can be found at: https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/GFE66K.
Abstract（参考訳）: 本稿では,20ヶ月以上にわたって発行された313の地域ニュースサイト(2020年4月4日～2021年12月31日)から,140万以上のオンラインニュース記事のデータセットを提案する。これらの出口は全米の地理的に多様な地域社会をカバーしている。地域住民の特徴を推定するために、このニュース記事に含まれるデータは、人口統計、2020年の大統領選挙の投票シェア、アメリカ合衆国国勢調査局からのコミュニティ・レジリエンス推定など、幅広い郡レベルのメタデータである。 NELA-Localデータセットは、https://dataverse.harvard.edu/dataset.xhtml? persistentId=doi:10.7910/DVN/GFE66K

関連論文リスト

The NetMob25 Dataset: A High-resolution Multi-layered View of Individual Mobility in Greater Paris Region [64.30214722988666]
本稿では,提案したデータセットのサーベイ設計,収集プロトコル,処理手法,特徴について述べる。データセットには、人口統計、社会経済、家庭の特徴を記述した個人データベース(i)、タイムスタンプ、輸送モード、旅行目的を含む8,000以上の注釈付き変位を持つトリプスデータベース(ii)、約5億の高周波ポイントからなるRaw GPSトレースデータベース(iii)の3つのコンポーネントが含まれている。
論文参考訳（メタデータ） (2025-06-06T09:22:21Z)
Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan Election [49.35115948941981]
Uchaguzi-2022は、2022年のケニア総選挙に関する14kの分類と地理タグ付き市民報告のデータセットである。このデータセットを使用して、言語モデルがレポートの分類とジオタグ化に役立てられるかどうかを調査し、AI for Social Goodスペースにおけるその可能性を強調します。
論文参考訳（メタデータ） (2024-12-17T17:08:35Z)
3DLNews: A Three-decade Dataset of US Local News Articles [49.1574468325115]
3DLNewsは、1996年から2024年までの期間にアメリカのローカルニュース記事を載せた、新しいデータセットである。約100万のURL(HTMLテキストを含む)があり、50州で14,000以上の地元新聞、テレビ、ラジオ局から提供されている。
論文参考訳（メタデータ） (2024-08-08T18:33:37Z)
Analyzing the Impact of Fake News on the Anticipated Outcome of the 2024 Election Ahead of Time [7.1970442944315245]
フェイクニュースに関する認識と研究の高まりにもかかわらず、北米の政治演説の中で人種的スラリーや偏見を特にターゲットとするデータセットは、依然として大きな必要性がある。本研究では、これらの誤情報の重要な側面を照らす包括的データセットを紹介する。
論文参考訳（メタデータ） (2023-12-01T20:14:16Z)
Design and analysis of tweet-based election models for the 2021 Mexican legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文参考訳（メタデータ） (2023-01-02T12:40:05Z)
Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文参考訳（メタデータ） (2022-10-26T02:25:23Z)
News Category Dataset [1.7513645771137178]
HuffPostから入手した2012年から2018年までの約200万のニュースの見出しを含むNews Categoryデータセットを提示する。本稿では,データセットから新たな知見を導き,データセットの既存および潜在的応用について述べる。
論文参考訳（メタデータ） (2022-09-23T06:13:16Z)
Datasets: A Community Library for Natural Language Processing [55.48866401721244]
データセットは、現代のNLPのためのコミュニティライブラリである。このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
論文参考訳（メタデータ） (2021-09-07T03:59:22Z)
Counting Protests in News Articles: A Dataset and Semi-Automated Data Collection Pipeline [0.0]
2017年1月から2021年1月にかけて、米国の何千もの地元メディアが、市民権、移民、銃、環境などに関する42,000以上の抗議活動について報告した。われわれは、2017年1月から2021年1月までに米国で報告された42,347の抗議イベントに対応する、ニュース記事URL、日付、場所、人口規模の推定値、および494の個別記述タグのデータセットを公表した。
論文参考訳（メタデータ） (2021-02-01T15:35:21Z)
CovidNet: To Bring Data Transparency in the Era of COVID-19 [9.808021836153712]
本稿では,大規模流行データセットに関連付けられた新型コロナウイルス追跡プロジェクトであるCovidNetについて述べる。 CovidNetは、世界27か国から4,124のサブディビジョンのリアルタイムグローバルケース情報を提供する唯一のプラットフォームである。データセットの正確性と鮮度は、自発的なチームワーク、クラウドソーシングチャネル、自動データパイプラインによる苦労の結果です。
論文参考訳（メタデータ） (2020-05-22T00:05:17Z)
365 Dots in 2019: Quantifying Attention of News Sources [69.50862982117125]
様々な情報源から,オンラインニュース記事の話題の重複を計測する。ほぼリアルタイムで注目度に応じてニュースストーリーを採点する。これにより、最も注目を集めているトピックを識別するなど、複数の研究が可能になる。
論文参考訳（メタデータ） (2020-03-22T20:32:47Z)
NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文参考訳（メタデータ） (2020-01-10T09:26:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。