論文の概要: Inferring fine-grained migration patterns across the United States
- arxiv url: http://arxiv.org/abs/2503.20989v2
- Date: Fri, 06 Jun 2025 17:38:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:42.913989
- Title: Inferring fine-grained migration patterns across the United States
- Title(参考訳): 米国内におけるきめ細かい移動パターンの推測
- Authors: Gabriel Agostini, Rachel Young, Maria Fitzpatrick, Nikhil Garg, Emma Pierson,
- Abstract要約: 我々は、高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
私たちは2010年から2019年までの年次移行行列のデータセットであるMIGRATEを作成し、47億組のCensus Block Groupのフローをキャプチャします。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
- 参考スコア(独自算出の注目度): 1.6594124470436404
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained migration data illuminate important demographic, environmental, and health phenomena. However, migration datasets within the United States remain lacking: publicly available Census data are neither spatially nor temporally granular, and proprietary data have higher resolution but demographic and other biases. To address these limitations, we develop a scalable iterative-proportional-fitting based method that reconciles high-resolution but biased proprietary data with low-resolution but more reliable Census data. We apply this method to produce MIGRATE, a dataset of annual migration matrices from 2010 - 2019 that captures flows between 47.4 billion pairs of Census Block Groups -- about four thousand times more granular than publicly available data. These estimates are highly correlated with external ground-truth datasets, and improve accuracy and reduce bias relative to raw proprietary data. We use MIGRATE to analyze both national and local migration patterns. Nationally, we document temporal and demographic variation in homophily, upward mobility, and moving distance: for example, we find that people are increasingly likely to move to top-income-quartile CBGs and identify racial disparities in upward mobility. We also show that MIGRATE can illuminate important local migration patterns, including out-migration in response to California wildfires, that are invisible in coarser previous datasets. We publicly release MIGRATE to provide a resource for migration research in the social, environmental, and health sciences.
- Abstract(参考訳): 詳細な移住データは、重要な人口統計、環境、健康現象を照らす。
公開されている国勢調査データは空間的にも時間的にも粒度的にもなく、プロプライエタリなデータは高い解像度を持つが、人口統計やその他のバイアスがある。
これらの制約に対処するため、我々は高解像度だが偏りのあるプロプライエタリなデータを低解像度で信頼性の高いCensusデータで再現するスケーラブルな反復補間法を開発した。
この手法を適用して、2010年から2019年までの年次移行行列のデータセットであるMIGRATEを生成し、4740億対のCensus Block Groupのフローをキャプチャする。
これらの推定は、外部の地中構造データセットと高い相関関係を持ち、精度を改善し、生のプロプライエタリなデータに対するバイアスを低減する。
我々はMIGRATEを用いて、国内と地域の両方のマイグレーションパターンを分析します。
全国的には、ホモフィリー、アッパーモビリティ、移動距離の時間的および人口動態の変化を文書化しています。例えば、人々はトップ・インカム・クアータイルのCBGに移行し、上層モビリティにおける人種的格差を識別する傾向が強まっているのです。
また、MIGRATEは、カリフォルニアの山火事に応答して移住するなど、過去のデータセットで見えないような重要な地域移動パターンを照らすことができることを示した。
我々は、社会、環境、健康科学における移住研究の資源を提供するために、MIGRATEを公開している。
関連論文リスト
- Data Pruning in Generative Diffusion Models [2.0111637969968]
生成モデルは、データの基盤となる分布を推定することを目的としている。
大規模データセットにおける冗長データやノイズデータの排除は,特に戦略的に行う場合,特に有益であることを示す。
論文 参考訳(メタデータ) (2024-11-19T14:13:25Z) - Labor Migration Modeling through Large-scale Job Query Data [36.87413768190629]
本稿では,大規模ジョブクエリデータを活用した深層学習に基づく時空間労働移動分析フレームワークDHG-SILを提案する。
具体的には,世界最大規模の検索エンジンからの求人情報による労働移動のプロキシとして,まず最初に労働移動の意図を取得する。
都市の移動特性を定量化するための4つの解釈変数を導入し、都市表現と協調して最適化する。
論文 参考訳(メタデータ) (2024-10-03T16:24:14Z) - Enriching Datasets with Demographics through Large Language Models: What's in a Name? [5.871504332441324]
LLM(Large Language Models)は、特殊なデータに基づいてトレーニングされた振る舞いモデルだけでなく、パフォーマンスも向上する。
香港の認可された金融専門家の実際のデータセットを含む、さまざまなデータセットにこれらのLCMを適用します。
論文 参考訳(メタデータ) (2024-09-17T18:40:49Z) - A Highly Granular Temporary Migration Dataset Derived From Mobile Phone Data in Senegal [0.0]
本稿では,セネガルにおける一時的な移動を捉えるために携帯電話のデータを活用する,詳細なオープンアクセスデータセットを紹介する。
本稿では,デジタルトレースにおける一時的なマイグレーションイベントを検出するアルゴリズム手法を含むだけでなく,個々のトラジェクトリをコヒーレントなマイグレーション統計に集約する上でも重要な課題に対処する手法について述べる。
論文 参考訳(メタデータ) (2024-06-21T14:58:28Z) - Combining Twitter and Mobile Phone Data to Observe Border-Rush: The Turkish-European Border Opening [2.5693085674985117]
2020年にトルコが国境管理を廃止すると決定すると、多くの個人がギリシャ、ブルガリア、トルコの国境に向かって旅した。
しかし、メディアレポートと実際の移行パターンの間の不規則な移動と不一致に関する検証可能な統計が欠如しているため、さらなる調査が必要である。
本研究は,新しいデータソース,特に携帯電話とTwitterのデータを活用することで,この知識ギャップを埋めることを目的とする。
論文 参考訳(メタデータ) (2024-05-21T09:51:15Z) - Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文 参考訳(メタデータ) (2024-04-15T19:06:37Z) - Trust your Good Friends: Source-free Domain Adaptation by Reciprocal
Neighborhood Clustering [50.46892302138662]
我々は、ソースデータがない場合に、ソース事前学習されたモデルをターゲット領域に適応させる、ソースフリー領域適応問題に対処する。
提案手法は,ソースドメイン分類器と一致しない可能性のあるターゲットデータが,依然として明確なクラスタを形成しているという観測に基づいている。
本研究では, この地域構造を, 地域住民, 相互隣人, 及び拡張近所を考慮し, 効率的に把握できることを実証する。
論文 参考訳(メタデータ) (2023-09-01T15:31:18Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy
Protection Methods [0.0]
アメリカ合衆国国勢調査局は、国勢調査統計の正確さと個々の情報の保護との間に難しいトレードオフに直面している。
我々は,2つの主要な開示回避システムによって誘導されるバイアスとノイズの独立評価を行う。
TopDownのポストプロセッシングはNMFノイズを劇的に低減し、スワップの精度に類似したデータを生成する。
論文 参考訳(メタデータ) (2023-06-13T03:30:19Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Estimating Latent Population Flows from Aggregated Data via Inversing
Multi-Marginal Optimal Transport [57.16851632525864]
累積カウントデータから潜在人口フローを推定する問題について検討する。
この問題は、プライバシーの問題や測定の不確実性のために個々の軌道が利用できない場合に発生する。
我々はMOTフレームワークのコスト関数を学習し,集約データからの遷移フローを推定する。
論文 参考訳(メタデータ) (2022-12-30T03:03:23Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - Releasing survey microdata with exact cluster locations and additional
privacy safeguards [77.34726150561087]
本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
論文 参考訳(メタデータ) (2022-05-24T19:37:11Z) - Leveraging Mobile Phone Data for Migration Flows [5.0161988361764775]
移動フローに関する統計は、しばしば固有の制限に悩まされる国勢調査データから導かれる。
調査やフィールド観測などの代替データソースも、信頼性、コスト、スケール制限に悩まされている。
携帯電話の普及により、移動に関連する最新のデータの正確かつ効率的な収集が可能になる。
論文 参考訳(メタデータ) (2021-05-31T13:41:47Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Leveraging Administrative Data for Bias Audits: Assessing Disparate
Coverage with Mobility Data for COVID-19 Policy [61.60099467888073]
管理データのリンクによって,バイアスに対するモビリティデータの監査が可能かを示す。
我々は、高齢者や非白人の有権者が移動データによって捕えられる可能性が低いことを示した。
このような移動データに基づく公衆衛生資源の配分は、高リスク高齢者や少数民族に不当に害を与える可能性があることを示す。
論文 参考訳(メタデータ) (2020-11-14T02:04:14Z) - Forecasting asylum-related migration flows with machine learning and
data at scale [0.0]
適応型機械学習アルゴリズムは,亡命関係の移動フローを効果的に予測できることを示す。
我々は、起源の国における位置情報のイベントとインターネット検索、EU国境における不規則な横断の検知、目的地の国における亡命承認率という3つの階層のデータを活用している。
論文 参考訳(メタデータ) (2020-11-09T11:31:17Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z) - Enhancing Facial Data Diversity with Style-based Face Aging [59.984134070735934]
特に、顔データセットは、通常、性別、年齢、人種などの属性の観点からバイアスされる。
本稿では, 細粒度の老化パターンをキャプチャするデータ拡張のための, 生成スタイルに基づく新しいアーキテクチャを提案する。
提案手法は, 年齢移動のための最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-06T21:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。