論文の概要: Europepolls: A Dataset of Country-Level Opinion Polling Data for the
European Union and the UK
- arxiv url: http://arxiv.org/abs/2307.10022v1
- Date: Wed, 19 Jul 2023 15:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 13:38:29.396240
- Title: Europepolls: A Dataset of Country-Level Opinion Polling Data for the
European Union and the UK
- Title(参考訳): Europepolls: 欧州連合と英国のための国レベルの意見ポーリングデータのデータセット
- Authors: Konstantinos Pitas
- Abstract要約: 欧州連合と英国における国レベルの歴史的世論調査データの公開データセットを提案する。
データはWikipediaから収集され、パンダライブラリを使って前処理された。
- 参考スコア(独自算出の注目度): 6.09170287691728
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: I propose an open dataset of country-level historical opinion polling data
for the European Union and the UK. The dataset aims to fill a gap in available
opinion polling data for the European Union. Some existing datasets are
restricted to the past five years, limiting research opportunities. At the same
time, some larger proprietary datasets exist but are available only in a visual
preprocessed time series format. Finally, while other large datasets for
individual countries might exist, these could be inaccessible due to language
barriers. The data was gathered from Wikipedia, and preprocessed using the
pandas library. Both the raw and the preprocessed data are in the .csv format.
I hope that given the recent advances in LLMs and deep learning in general,
this large dataset will enable researchers to uncover complex interactions
between multimodal data (news articles, economic indicators, social media) and
voting behavior. The raw data, the preprocessed data, and the preprocessing
scripts are available on GitHub.
- Abstract(参考訳): 欧州連合と英国における国レベルの歴史的世論調査データの公開データセットを提案する。
このデータセットは欧州連合(EU)の世論調査データのギャップを埋めることを目的としている。
既存のデータセットは過去5年間に限られており、研究の機会は限られている。
同時に、いくつかの大きなプロプライエタリデータセットが存在するが、視覚的に事前処理された時系列フォーマットでのみ利用可能である。
最後に、個々の国のための他の大きなデータセットが存在するかもしれないが、言語障壁のためアクセスできない可能性がある。
データはwikipediaから収集され、pandasライブラリを使って事前処理された。
raw とプリプロセスデータの両方が .net に含まれている。
csvフォーマット。
LLMやディープラーニング全般の最近の進歩を踏まえると、この大規模なデータセットは、研究者がマルチモーダルデータ(ニュース記事、経済指標、ソーシャルメディア)と投票行動の間の複雑な相互作用を明らかにすることができることを願っています。
生データ、前処理されたデータ、前処理スクリプトはgithubで入手できる。
関連論文リスト
- OpenDataLab: Empowering General Artificial Intelligence with Open Datasets [53.22840149601411]
本稿では,多様なデータソース間のギャップと統一データ処理の必要性を埋めるプラットフォームであるOpenDataLabを紹介する。
OpenDataLabは、幅広いオープンソースのAIデータセットを統合し、インテリジェントクエリと高速ダウンロードサービスを通じて、データ取得効率を向上させる。
我々は,OpenDataLabが人工知能(AGI)の研究を大幅に促進し,関連するAI分野の進歩を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-04T10:42:01Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - Data Commons [4.568270630281101]
Data Commonsは、共通のスキーマでデータをパブリッシュし、Data Commons APIを使用して相互運用する、サイトの分散ネットワークである。
本稿では、主要なデプロイメントのいくつかであるData Commonsのアーキテクチャを説明し、今後の作業の方向性を強調します。
論文 参考訳(メタデータ) (2023-09-08T00:14:09Z) - DataFinder: Scientific Dataset Recommendation from Natural Language
Descriptions [100.52917027038369]
我々は、短い自然言語記述を与えられたデータセットを推奨するタスクを運用する。
この作業を容易にするために、我々は、より大規模な自動構築トレーニングセットと、より少ない専門家によるアノテート評価セットからなるDataFinderデータセットを構築した。
このシステムは、DataFinderデータセットに基づいてトレーニングされ、既存のサードパーティのデータセット検索エンジンよりも関連性の高い検索結果を見つける。
論文 参考訳(メタデータ) (2023-05-26T05:22:36Z) - Packaging code for reproducible research in the public sector [0.0]
jtstatsプロジェクトは、大規模で複雑なデータセットをインポート、処理、視覚化するためのRとPythonパッケージで構成されている。
Jtstatsは、パブリックセクター内外において、ドメイン固有のパッケージが再現可能な研究を可能にする方法を示している。
論文 参考訳(メタデータ) (2023-05-25T16:07:24Z) - Few-shot Learning for Multi-modal Social Media Event Filtering [16.999039588021255]
ソーシャルメディアは、イベント分析の重要なデータソースとなっている。
イベントフィルタリングの既存のソリューションのほとんどは、トレーニングのための完全に教師付きメソッドに依存しています。
本稿では,ラベル付きサンプル学習問題に対処するグラフベースの数ショット学習パイプラインを提案する。
論文 参考訳(メタデータ) (2022-11-16T22:50:33Z) - A scalable pipeline for COVID-19: the case study of Germany, Czechia and
Poland [7.753854979677439]
複数のデータソースからデータセットを統合するために,運用データストア(ODS)を構築した。
ODSは、ドイツ、チェコ、ポーランドの新型コロナウイルス(COVID-19)データを保管するだけでなく、他の地域も保存するために構築されている。
データは、バージョン管理されたArimaHoltモデルとその他の分析を使用して予測をサポートし、意思決定をサポートするだけでなく、リスク電卓やアプリもサポートする。
論文 参考訳(メタデータ) (2022-08-27T05:14:01Z) - DataLab: A Platform for Data Analysis and Intervention [96.75253335629534]
DataLabは統一されたデータ指向プラットフォームであり、ユーザはデータの特徴をインタラクティブに分析することができる。
ツールネームには、データセットレコメンデーションとグローバルビジョン分析のための機能がある。
これまでのところ、DataLabは1,715のデータセットと3,583の変換バージョンをカバーしている。
論文 参考訳(メタデータ) (2022-02-25T18:32:19Z) - Retiring Adult: New Datasets for Fair Machine Learning [47.27417042497261]
UCIアダルトは、多くのアルゴリズム的公正な介入の開発と比較の基礎として機能している。
UCIアダルトデータのスーパーセットを米国国勢調査資料から再構築し、その外部妥当性を制限するUCIアダルトデータセットの慣用性を明らかにする。
私たちの主な貢献は、公正な機械学習の研究のために既存のデータエコシステムを拡張する、一連の新しいデータセットです。
論文 参考訳(メタデータ) (2021-08-10T19:19:41Z) - Open Graph Benchmark: Datasets for Machine Learning on Graphs [86.96887552203479]
スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。
OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。
各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
論文 参考訳(メタデータ) (2020-05-02T03:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。