論文の概要: Inferring fine-grained migration patterns across the United States
- arxiv url: http://arxiv.org/abs/2503.20989v2
- Date: Fri, 06 Jun 2025 17:38:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:42.913989
- Title: Inferring fine-grained migration patterns across the United States
- Title(参考訳): 米国内におけるきめ細かい移動パターンの推測
- Authors: Gabriel Agostini, Rachel Young, Maria Fitzpatrick, Nikhil Garg, Emma Pierson,
- Abstract要約: 我々は、高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
私たちは2010年から2019年までの年次移行行列のデータセットであるMIGRATEを作成し、47億組のCensus Block Groupのフローをキャプチャします。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
- 参考スコア(独自算出の注目度): 1.6594124470436404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained migration data illuminate important demographic, environmental, and health phenomena. However, migration datasets within the United States remain lacking: publicly available Census data are neither spatially nor temporally granular, and proprietary data have higher resolution but demographic and other biases. To address these limitations, we develop a scalable iterative-proportional-fitting based method that reconciles high-resolution but biased proprietary data with low-resolution but more reliable Census data. We apply this method to produce MIGRATE, a dataset of annual migration matrices from 2010 - 2019 that captures flows between 47.4 billion pairs of Census Block Groups -- about four thousand times more granular than publicly available data. These estimates are highly correlated with external ground-truth datasets, and improve accuracy and reduce bias relative to raw proprietary data. We use MIGRATE to analyze both national and local migration patterns. Nationally, we document temporal and demographic variation in homophily, upward mobility, and moving distance: for example, we find that people are increasingly likely to move to top-income-quartile CBGs and identify racial disparities in upward mobility. We also show that MIGRATE can illuminate important local migration patterns, including out-migration in response to California wildfires, that are invisible in coarser previous datasets. We publicly release MIGRATE to provide a resource for migration research in the social, environmental, and health sciences.
- Abstract(参考訳): 詳細な移住データは、重要な人口統計、環境、健康現象を照らす。
公開されている国勢調査データは空間的にも時間的にも粒度的にもなく、プロプライエタリなデータは高い解像度を持つが、人口統計やその他のバイアスがある。
これらの制約に対処するため、我々は高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
この手法を適用して、2010年から2019年までの年次移行行列のデータセットであるMIGRATEを生成し、4740億対のCensus Block Groupのフローをキャプチャする。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
我々はMIGRATEを用いて、国内と地域の両方のマイグレーションパターンを分析します。
全国的には、ホモフィリー、アッパーモビリティ、移動距離の時間的および人口動態の変化を文書化しています。例えば、人々はトップ・インカム・クアータイルのCBGに移行し、上層モビリティにおける人種的格差を識別する傾向が強まっているのです。
また、MIGRATEは、カリフォルニアの山火事に応答して移住するなど、過去のデータセットで見えないような重要な地域移動パターンを照らすことができることを示した。
我々は、社会、環境、健康科学における移住研究の資源を提供するために、MIGRATEを公開している。
関連論文リスト
- Data Pruning in Generative Diffusion Models [2.0111637969968]
生成モデルは、データの基盤となる分布を推定することを目的としている。
大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文 参考訳(メタデータ) (2024-11-19T14:13:25Z) - Enriching Datasets with Demographics through Large Language Models: What's in a Name? [5.871504332441324]
LLM(Large Language Models)は、特殊なデータに基づいてトレーニングされた振る舞いモデルだけでなく、パフォーマンスも向上する。
香港の認可された金融専門家の実際のデータセットを含む、さまざまなデータセットにこれらのLCMを適用します。
論文 参考訳(メタデータ) (2024-09-17T18:40:49Z) - A Highly Granular Temporary Migration Dataset Derived From Mobile Phone Data in Senegal [0.0]
本稿では,セネガルにおける一時的な移動を捉えるために携帯電話のデータを活用する,詳細なオープンアクセスデータセットを紹介する。
本稿では,デジタルトレースにおける一時的なマイグレーションイベントを検出するアルゴリズム手法を含むだけでなく,個々のトラジェクトリをコヒーレントなマイグレーション統計に集約する上でも重要な課題に対処する手法について述べる。
論文 参考訳(メタデータ) (2024-06-21T14:58:28Z) - Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文 参考訳(メタデータ) (2024-04-15T19:06:37Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy
Protection Methods [0.0]
アメリカ合衆国国勢調査局は、国勢調査統計の正確さと個々の情報の保護との間に難しいトレードオフに直面している。
我々は,2つの主要な開示回避システムによって誘導されるバイアスとノイズの独立評価を行う。
TopDownのポストプロセッシングはNMFノイズを劇的に低減し、スワップの精度に類似したデータを生成する。
論文 参考訳(メタデータ) (2023-06-13T03:30:19Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Estimating Latent Population Flows from Aggregated Data via Inversing
Multi-Marginal Optimal Transport [57.16851632525864]
累積カウントデータから潜在人口フローを推定する問題について検討する。
この問題は、プライバシーの問題や測定の不確実性のために個々の軌道が利用できない場合に発生する。
我々はMOTフレームワークのコスト関数を学習し,集約データからの遷移フローを推定する。
論文 参考訳(メタデータ) (2022-12-30T03:03:23Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - Leveraging Mobile Phone Data for Migration Flows [5.0161988361764775]
移動フローに関する統計は、しばしば固有の制限に悩まされる国勢調査データから導かれる。
調査やフィールド観測などの代替データソースも、信頼性、コスト、スケール制限に悩まされている。
携帯電話の普及により、移動に関連する最新のデータの正確かつ効率的な収集が可能になる。
論文 参考訳(メタデータ) (2021-05-31T13:41:47Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。