論文の概要: Combining the Strengths of Dutch Survey and Register Data in a Data Challenge to Predict Fertility (PreFer)
- arxiv url: http://arxiv.org/abs/2402.00705v2
- Date: Fri, 22 Mar 2024 15:13:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 22:01:03.155583
- Title: Combining the Strengths of Dutch Survey and Register Data in a Data Challenge to Predict Fertility (PreFer)
- Title(参考訳): 出生率予測のためのデータチャレンジにおけるオランダ調査の強さと登録データの組み合わせ(PreFer)
- Authors: Elizaveta Sivak, Paulina Pankowska, Adrienne Mendrik, Tom Emery, Javier Garcia-Bernardo, Seyit Hocuk, Kasia Karpinska, Angelica Maineri, Joris Mulder, Malvina Nissim, Gert Stulp,
- Abstract要約: オランダにおける出生率の予測可能性を調べるために,2つのデータセットを提案する。
1つのデータセットは、幅広いトピックに関する数千の変数を含む縦断調査であるISSパネルに基づいている。
もう一つはオランダの登録データに基づいており、位置データに欠けるが、オランダの住民数百万人のライフコースに関する詳細な情報を含んでいる。
- 参考スコア(独自算出の注目度): 8.4153358785173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The social sciences have produced an impressive body of research on determinants of fertility outcomes, or whether and when people have children. However, the strength of these determinants and underlying theories are rarely evaluated on their predictive ability on new data. This prevents us from systematically comparing studies, hindering the evaluation and accumulation of knowledge. In this paper, we present two datasets which can be used to study the predictability of fertility outcomes in the Netherlands. One dataset is based on the LISS panel, a longitudinal survey which includes thousands of variables on a wide range of topics, including individual preferences and values. The other is based on the Dutch register data which lacks attitudinal data but includes detailed information about the life courses of millions of Dutch residents. We provide information about the datasets and the samples, and describe the fertility outcome of interest. We also introduce the fertility prediction data challenge PreFer which is based on these datasets and will start in Spring 2024. We outline the ways in which measuring the predictability of fertility outcomes using these datasets and combining their strengths in the data challenge can advance our understanding of fertility behaviour and computational social science. We further provide details for participants on how to take part in the data challenge.
- Abstract(参考訳): 社会科学は、生殖結果の決定要因、または、人々が子供を持つかどうか、そしていつになるかについて、印象的な研究結果を生み出している。
しかし、これらの行列式と基礎となる理論の強さは、新しいデータに対する予測能力で評価されることは滅多にない。
これにより、学習を体系的に比較することができず、知識の評価と蓄積を妨げます。
本稿では,オランダにおける出生率の予測可能性を調べるために利用可能な2つのデータセットについて述べる。
1つのデータセットは、個別の好みや値を含む幅広いトピックに関する数千の変数を含む縦断調査であるISSパネルに基づいている。
もう一つはオランダの登録データに基づいており、位置データに欠けるが、オランダの住民数百万人のライフコースに関する詳細な情報を含んでいる。
我々は、データセットとサンプルに関する情報を提供し、関心の豊かさの結果を説明する。
PreFerはこれらのデータセットに基づいており、2024年の春に開始されます。
これらのデータセットを用いて出生率の予測可能性を測定し、データチャレンジにおけるその強みを組み合わせることで、出生率行動と計算社会科学の理解を深める方法について概説する。
さらに、参加者がデータチャレンジに参加する方法の詳細も提供します。
関連論文リスト
- Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Dataset Bias in Human Activity Recognition [57.91018542715725]
このコントリビューションは、トレーニングデータを統計的にキュレートし、人間の身体的特性がHARのパフォーマンスにどの程度影響するかを評価する。
時系列HARのセンサ,アクティビティ,記録の異なる2つのHARデータセット上で,最先端の畳み込みニューラルネットワークの性能を評価する。
論文 参考訳(メタデータ) (2023-01-19T12:33:50Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Retiring Adult: New Datasets for Fair Machine Learning [47.27417042497261]
UCIアダルトは、多くのアルゴリズム的公正な介入の開発と比較の基礎として機能している。
UCIアダルトデータのスーパーセットを米国国勢調査資料から再構築し、その外部妥当性を制限するUCIアダルトデータセットの慣用性を明らかにする。
私たちの主な貢献は、公正な機械学習の研究のために既存のデータエコシステムを拡張する、一連の新しいデータセットです。
論文 参考訳(メタデータ) (2021-08-10T19:19:41Z) - Extracting candidate factors affecting long-term trends of student
abilities across subjects [0.0]
学生の長期成績データは、学生のスキルが被験者の将来のトレンドにどのような影響を及ぼすかという研究の問題を定式化するのに有用な情報を提供する。
本研究では,被験者間の長期的傾向に影響を与える要因を長期的データから抽出する手法を提案する。
論文 参考訳(メタデータ) (2021-03-11T04:13:58Z) - Machine Learning and Data Science approach towards trend and predictors
analysis of CDC Mortality Data for the USA [0.0]
調査では、性別やその中心的な傾向に関わらず(サンプルに基づいて)平均寿命が決定された。
この研究は、機械学習の予測が、データにとって明らかなほど有効ではないことを示しています。
論文 参考訳(メタデータ) (2020-09-11T12:46:57Z) - Bringing the People Back In: Contesting Benchmark Machine Learning
Datasets [11.00769651520502]
機械学習データの系譜である研究プログラムを概説し、これらのデータセットの作成方法と理由について検討する。
機械学習におけるベンチマークデータセットを基盤として運用する方法を解説し、これらのデータセットについて4つの研究課題を提起する。
論文 参考訳(メタデータ) (2020-07-14T23:22:13Z) - Jointly Predicting Job Performance, Personality, Cognitive Ability,
Affect, and Well-Being [42.67003631848889]
本研究では,身体的および生理的行動,心理的状態と特徴,職能を統合した個人予測分析のためのベンチマークを作成する。
我々は、データマイニング技術をベンチマークとして設計し、ウェアラブルセンサから得られた真のノイズと不完全なデータを用いて、12の標準化された精確なテストに基づいて19の構造を予測する。
論文 参考訳(メタデータ) (2020-06-10T14:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。