論文の概要: Inferring fine-grained migration patterns across the United States
- arxiv url: http://arxiv.org/abs/2503.20989v1
- Date: Wed, 26 Mar 2025 21:07:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:53:48.394266
- Title: Inferring fine-grained migration patterns across the United States
- Title(参考訳): 米国内におけるきめ細かい移動パターンの推測
- Authors: Gabriel Agostini, Rachel Young, Maria Fitzpatrick, Nikhil Garg, Emma Pierson,
- Abstract要約: 我々は、高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
この手法を適用して,2010年から2019年までの年間移動行列のデータセットであるMIGRATEを作成し,47億組のCensus Block Groupのフローをキャプチャする。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
- 参考スコア(独自算出の注目度): 1.6594124470436404
- License:
- Abstract: Fine-grained migration data illuminate important demographic, environmental, and health phenomena. However, migration datasets within the United States remain lacking: publicly available Census data are neither spatially nor temporally granular, and proprietary data have higher resolution but demographic and other biases. To address these limitations, we develop a scalable iterative-proportional-fitting based method which reconciles high-resolution but biased proprietary data with low-resolution but more reliable Census data. We apply this method to produce MIGRATE, a dataset of annual migration matrices from 2010 - 2019 which captures flows between 47.4 billion pairs of Census Block Groups -- about four thousand times more granular than publicly available data. These estimates are highly correlated with external ground-truth datasets, and improve accuracy and reduce bias relative to raw proprietary data. We publicly release MIGRATE estimates and provide a case study illustrating how they reveal granular patterns of migration in response to California wildfires.
- Abstract(参考訳): 詳細な移住データは、重要な人口統計、環境、健康現象を照らす。
公開されている国勢調査データは空間的にも時間的にも粒度的にもなく、プロプライエタリなデータは高い解像度を持つが、人口統計やその他のバイアスがある。
これらの制約に対処するため、我々は高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
この手法を適用して、2010年から2019年までの年次移行行列のデータセットであるMIGRATEを生成し、4740億対のCensus Block Groupのフローをキャプチャする。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
カリフォルニア州の山火事に対する移民の粒状パターンを明らかにするためのケーススタディを公開し、MIGRATEの推定結果を公開している。
関連論文リスト
- Data Pruning in Generative Diffusion Models [2.0111637969968]
生成モデルは、データの基盤となる分布を推定することを目的としている。
大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文 参考訳(メタデータ) (2024-11-19T14:13:25Z) - Enriching Datasets with Demographics through Large Language Models: What's in a Name? [5.871504332441324]
LLM(Large Language Models)は、特殊なデータに基づいてトレーニングされた振る舞いモデルだけでなく、パフォーマンスも向上する。
香港の認可された金融専門家の実際のデータセットを含む、さまざまなデータセットにこれらのLCMを適用します。
論文 参考訳(メタデータ) (2024-09-17T18:40:49Z) - A Highly Granular Temporary Migration Dataset Derived From Mobile Phone Data in Senegal [0.0]
本稿では,セネガルにおける一時的な移動を捉えるために携帯電話のデータを活用する,詳細なオープンアクセスデータセットを紹介する。
本稿では,デジタルトレースにおける一時的なマイグレーションイベントを検出するアルゴリズム手法を含むだけでなく,個々のトラジェクトリをコヒーレントなマイグレーション統計に集約する上でも重要な課題に対処する手法について述べる。
論文 参考訳(メタデータ) (2024-06-21T14:58:28Z) - Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文 参考訳(メタデータ) (2024-04-15T19:06:37Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Estimating Latent Population Flows from Aggregated Data via Inversing
Multi-Marginal Optimal Transport [57.16851632525864]
累積カウントデータから潜在人口フローを推定する問題について検討する。
この問題は、プライバシーの問題や測定の不確実性のために個々の軌道が利用できない場合に発生する。
我々はMOTフレームワークのコスト関数を学習し,集約データからの遷移フローを推定する。
論文 参考訳(メタデータ) (2022-12-30T03:03:23Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - Leveraging Mobile Phone Data for Migration Flows [5.0161988361764775]
移動フローに関する統計は、しばしば固有の制限に悩まされる国勢調査データから導かれる。
調査やフィールド観測などの代替データソースも、信頼性、コスト、スケール制限に悩まされている。
携帯電話の普及により、移動に関連する最新のデータの正確かつ効率的な収集が可能になる。
論文 参考訳(メタデータ) (2021-05-31T13:41:47Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。