論文の概要: Copula-based transferable models for synthetic population generation
- arxiv url: http://arxiv.org/abs/2302.09193v2
- Date: Sat, 16 Mar 2024 15:48:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 06:38:27.388050
- Title: Copula-based transferable models for synthetic population generation
- Title(参考訳): コピュラを用いた人工集団生成のための転写可能モデル
- Authors: Pascal Jutras-Dubé, Mohammad B. Al-Khasawneh, Zhichao Yang, Javier Bas, Fabian Bastin, Cinzia Cirillo,
- Abstract要約: 集団合成は、マイクロエージェントの標的集団の合成的かつ現実的な表現を生成することを含む。
従来の手法は、しばしばターゲットのサンプルに依存し、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
- 参考スコア(独自算出の注目度): 1.370096215615823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Population synthesis involves generating synthetic yet realistic representations of a target population of micro-agents for behavioral modeling and simulation. Traditional methods, often reliant on target population samples, such as census data or travel surveys, face limitations due to high costs and small sample sizes, particularly at smaller geographical scales. We propose a novel framework based on copulas to generate synthetic data for target populations where only empirical marginal distributions are known. This method utilizes samples from different populations with similar marginal dependencies, introduces a spatial component into population synthesis, and considers various information sources for more realistic generators. Concretely, the process involves normalizing the data and treat it as realizations of a given copula, and then training a generative model before incorporating the information on the marginals of the target population. Utilizing American Community Survey data, we assess our framework's performance through standardized root mean squared error (SRMSE) and so-called sampled zeros. We focus on its capacity to transfer a model learned from one population to another. Our experiments include transfer tests between regions at the same geographical level as well as to lower geographical levels, hence evaluating the framework's adaptability in varied spatial contexts. We compare Bayesian Networks, Variational Autoencoders, and Generative Adversarial Networks, both individually and combined with our copula framework. Results show that the copula enhances machine learning methods in matching the marginals of the reference data. Furthermore, it consistently surpasses Iterative Proportional Fitting in terms of SRMSE in the transferability experiments, while introducing unique observations not found in the original training sample.
- Abstract(参考訳): 集団合成は、行動モデリングとシミュレーションのために、標的とするマイクロエージェントの人口の合成的かつ現実的な表現を生成する。
伝統的な手法は、国勢調査データや旅行調査のような対象の人口サンプルに依存することが多く、特に小さな地理的規模で、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
本手法は, 異なる個体群からのサンプルを類似の限界依存性で利用し, 空間成分を集団合成に導入し, より現実的な生成物として様々な情報源を検討する。
具体的には、このプロセスはデータを正規化し、それを与えられたコプラの実現として扱い、ターゲットの人口の限界に関する情報を組み込む前に生成モデルを訓練する。
American Community Surveyのデータを利用して、標準ルート平均二乗誤差(SRMSE)といわゆるサンプルゼロを用いて、我々のフレームワークの性能を評価する。
我々は、ある個体群から別の個体群へ学習したモデルを移す能力に焦点をあてる。
実験では,同じ地理的レベルの地域間での移動試験や,地理的レベルの低い地域間での移動試験を含め,様々な空間的文脈におけるフレームワークの適応性を評価する。
我々は,ベイジアンネットワーク,変分オートエンコーダ,ジェネレーティブ・アドバーサリアル・ネットワーク,およびコーパス・フレームワークを個別に組み合わせて比較した。
その結果,コプラは参照データの限界値にマッチする機械学習手法を強化することがわかった。
さらに、トランスファービリティ実験におけるSRMSEの観点では反復的比例フィッティングを一貫して上回り、元のトレーニングサンプルでは見つからないユニークな観察を導入した。
関連論文リスト
- A Deep Generative Framework for Joint Households and Individuals Population Synthesis [0.562479170374811]
世帯・個人・個人・個人関係を持つ合成集団を創出するための深い生成枠組みを提案する。
米国デラウェア州での申請の結果は、生成された家庭内レコードのリアリズムを確実にする能力を示している。
論文 参考訳(メタデータ) (2024-06-30T23:01:58Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Estimating Unknown Population Sizes Using the Hypergeometric Distribution [1.03590082373586]
総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。
本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。
実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-22T01:53:56Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - VFedMH: Vertical Federated Learning for Training Multiple Heterogeneous
Models [53.30484242706966]
本稿では,複数の異種モデル(VFedMH)を学習するための垂直フェデレーション学習という新しい手法を提案する。
被験者の局所的な埋め込み値を保護するために,軽量なブラインド・ファクターに基づく埋め込み保護手法を提案する。
実験により、VFedMHは、不均一な最適化で複数の異種モデルを同時に訓練し、モデル性能の最近の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-10-20T09:22:51Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Improving Heterogeneous Model Reuse by Density Estimation [105.97036205113258]
本稿では,異なる参加者の個人データを用いてモデルを学習することを目的とした多人数学習について検討する。
モデルの再利用は、各パーティーのためにローカルモデルがトレーニングされていると仮定して、マルチパーティの学習にとって有望なソリューションである。
論文 参考訳(メタデータ) (2023-05-23T09:46:54Z) - Heterogeneous Datasets for Federated Survival Analysis Simulation [6.489759672413373]
本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。
提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
論文 参考訳(メタデータ) (2023-01-28T11:37:07Z) - Robustness Analysis of Deep Learning Models for Population Synthesis [5.9106199000537645]
複数のデータセットに対するロバスト性を評価するため, 深部生成モデルのブートストラップ信頼区間を示す。
これらのモデルは、2008年、2013年、2018年のモントリオール・オリジン・デスチネーション・サーベイの複数の旅行日記に実装されている。
その結果,CTGANの予測誤差は,複数のデータセットに対する堅牢性を示す信頼区間が狭かった。
論文 参考訳(メタデータ) (2022-11-23T22:55:55Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z) - Composite Travel Generative Adversarial Networks for Tabular and
Sequential Population Synthesis [5.259027520298188]
本稿では,人口の関節分布を推定するためにCTGAN(Composite Travel Generative Adversarial Network)を提案する。
CTGANモデルは、変分オートエンコーダ(VAE)法など、最近提案された他の手法と比較される。
論文 参考訳(メタデータ) (2020-04-15T00:06:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。