論文の概要: A Double Machine Learning Trend Model for Citizen Science Data
- arxiv url: http://arxiv.org/abs/2210.15524v2
- Date: Wed, 10 May 2023 13:53:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-11 17:30:04.699473
- Title: A Double Machine Learning Trend Model for Citizen Science Data
- Title(参考訳): 市民科学データのための二重機械学習トレンドモデル
- Authors: Daniel Fink (1), Alison Johnston (2), Matt Strimas-Mackey (1), Tom
Auer (1), Wesley M. Hochachka (1), Shawn Ligocki (1), Lauren Oldham Jaromczyk
(1), Orin Robinson (1), Chris Wood (1), Steve Kelling (1), and Amanda D.
Rodewald (1) ((1) Cornell Lab of Ornithology, Cornell University, USA (2)
Centre for Research into Ecological and Environmental Modelling, School of
Maths and Statistics, University of St Andrews, St Andrews, UK)
- Abstract要約: 本稿では, 市民科学データに共通する年次共生を制御しながら, 種数傾向を推定するための新しいモデリング手法について述べる。
このアプローチはDouble Machine Learningに基づいており、このフレームワークは、機械学習手法を使って人口変化を推定し、データに見いだされたコンバウンディングの調整に使用される確率スコアを推定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: 1. Citizen and community-science (CS) datasets have great potential for
estimating interannual patterns of population change given the large volumes of
data collected globally every year. Yet, the flexible protocols that enable
many CS projects to collect large volumes of data typically lack the structure
necessary to keep consistent sampling across years. This leads to interannual
confounding, as changes to the observation process over time are confounded
with changes in species population sizes.
2. Here we describe a novel modeling approach designed to estimate species
population trends while controlling for the interannual confounding common in
citizen science data. The approach is based on Double Machine Learning, a
statistical framework that uses machine learning methods to estimate population
change and the propensity scores used to adjust for confounding discovered in
the data. Additionally, we develop a simulation method to identify and adjust
for residual confounding missed by the propensity scores. Using this new
method, we can produce spatially detailed trend estimates from citizen science
data.
3. To illustrate the approach, we estimated species trends using data from
the CS project eBird. We used a simulation study to assess the ability of the
method to estimate spatially varying trends in the face of real-world
confounding. Results showed that the trend estimates distinguished between
spatially constant and spatially varying trends at a 27km resolution. There
were low error rates on the estimated direction of population change
(increasing/decreasing) and high correlations on the estimated magnitude.
4. The ability to estimate spatially explicit trends while accounting for
confounding in citizen science data has the potential to fill important
information gaps, helping to estimate population trends for species, regions,
or seasons without rigorous monitoring data.
- Abstract(参考訳): 1. 市民と地域科学(CS)データセットは, 毎年収集される大量のデータから, 人口変動の経年変化パターンを推定する大きな可能性を秘めている。
しかし、多くのCSプロジェクトが大量のデータを収集できる柔軟なプロトコルは、通常、何年もにわたって一貫したサンプリングを維持するのに必要な構造を欠いている。
経時的観察過程の変化は種の個体群の大きさの変化と合致するので、これは年々合体する。
ここでは, 市民科学データに共通する大陸間共生を制御しつつ, 種数傾向を推定するための新しいモデリング手法について述べる。
このアプローチはDouble Machine Learningに基づいており、このフレームワークは、機械学習手法を使って人口変化を推定し、データに見いだされたコンバウンディングの調整に使用される確率スコアを推定する。
さらに,正規度スコアが欠落した残差の同定と調整を行うシミュレーション手法を開発した。
この新しい手法により,市民科学データから空間的詳細な傾向推定を作成できる。
アプローチを説明するため,CSプロジェクトeBirdのデータを用いて種の傾向を推定した。
本研究は,実世界のコンファウンディングに直面する空間的変動傾向を推定する手法の能力を評価するために,シミュレーションスタディを用いて行った。
その結果,27kmの解像度で空間定数と空間変動の傾向を区別できる傾向が得られた。
人口変動の予測方向(増加/減少)には誤り率が低く,推定規模には高い相関が認められた。
4. 市民科学データに埋もれながら空間的明らかな傾向を推定する能力は、重要な情報ギャップを埋める可能性があり、厳密なモニタリングデータなしで種・地域・季節の人口動向を推定するのに役立つ。
関連論文リスト
- Targeted Maximum Likelihood Estimation for Integral Projection Models in Population Ecology [4.209594014085132]
積分射影モデルから導出した特性に対する頑健で効率的な推定器を開発する。
本研究はIdaho steppe plant communityとRotifer populationsの長期研究から得られた実データを用いて広範囲にわたるシミュレーションを行う。
論文 参考訳(メタデータ) (2024-11-12T19:56:05Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Beyond Normal: On the Evaluation of Mutual Information Estimators [52.85079110699378]
そこで本研究では,既知の地道的相互情報を用いて,多種多様な分布群を構築する方法について述べる。
本稿では,問題の難易度に適応した適切な推定器の選択方法について,実践者のためのガイドラインを提供する。
論文 参考訳(メタデータ) (2023-06-19T17:26:34Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Mapping Urban Population Growth from Sentinel-2 MSI and Census Data
Using Deep Learning: A Case Study in Kigali, Rwanda [0.19116784879310023]
我々は,時間的集団動態を短時間で解き放つ深層学習変化検出技術の評価を行った。
Sentinel-2 MSIデータを用いた人口マッピングタスクで事前訓練されたResNetエンコーダを,シームズネットワークに組み込んだ。
このネットワークは人口変化を正確に予測するために国勢調査レベルで訓練された。
論文 参考訳(メタデータ) (2023-03-15T10:39:31Z) - Copula-based transferable models for synthetic population generation [1.370096215615823]
集団合成は、マイクロエージェントの標的集団の合成的かつ現実的な表現を生成することを含む。
従来の手法は、しばしばターゲットのサンプルに依存し、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-17T23:58:14Z) - Time-Varying Propensity Score to Bridge the Gap between the Past and Present [104.46387765330142]
本稿では,データ分布の段階的変化を検出するための時間変化確率スコアを提案する。
実装のさまざまな方法を示し、さまざまな問題について評価する。
論文 参考訳(メタデータ) (2022-10-04T07:21:49Z) - So2Sat POP -- A Curated Benchmark Data Set for Population Estimation
from Space on a Continental Scale [11.38584315242023]
欧州98都市における人口推定のための包括的データセットを提供する。
データセットは、デジタル標高モデル、地域気候帯、土地利用率、夜間光とマルチスペクトルセンチネル2画像の組み合わせ、およびOpen Street Mapイニシアチブのデータから構成される。
論文 参考訳(メタデータ) (2022-04-07T07:30:43Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Census-Independent Population Estimation using Representation Learning [0.5735035463793007]
代替データを用いた国勢調査非依存の人口推定手法は、頻繁に信頼性の高い人口推定を局所的に提供することを約束している。
モザンビークにおける近年の表現学習手法について検討し,人口推定への表現の伝達可能性を評価する。
表現学習を使用することで、特徴が自動的に抽出されるため、人間の監督が不要になる。
得られた人口推計をGRID3, Facebook (HRSL) および WorldPop の既存人口製品と比較した。
論文 参考訳(メタデータ) (2021-10-06T15:13:36Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。