論文の概要: Copula-based synthetic population generation
- arxiv url: http://arxiv.org/abs/2302.09193v1
- Date: Fri, 17 Feb 2023 23:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 20:00:22.558529
- Title: Copula-based synthetic population generation
- Title(参考訳): コプラ型人工集団発生
- Authors: Pascal Jutras-Dub\'e, Mohammad B. Al-Khasawneh, Zhichao Yang, Javier
Bas, Fabian Bastin and Cinzia Cirillo
- Abstract要約: 対象集団のための合成データを生成するためのコプラに基づく新しいフレームワークを提案する。
データを正規化し、与えられたコプラの実現として扱う。
我々は,正規化データから生成モデルを訓練し,限界値に関する情報を注入する。
- 参考スコア(独自算出の注目度): 0.2376767664163658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Population synthesis consists of generating synthetic but realistic
representations of a target population of micro-agents for the purpose of
behavioral modeling and simulation. We introduce a new framework based on
copulas to generate synthetic data for a target population of which only the
empirical marginal distributions are known by using a sample from another
population sharing similar marginal dependencies. This makes it possible to
include a spatial component in the generation of population synthesis and to
combine various sources of information to obtain more realistic population
generators. Specifically, we normalize the data and treat them as realizations
of a given copula, and train a generative model on the normalized data before
injecting the information on the marginals. We compare the copulas framework to
IPF and to modern probabilistic approaches such as Bayesian networks,
variational auto-encoders, and generative adversarial networks. We also
illustrate on American Community Survey data that the method proposed allows to
study the structure of the data at different geographical levels in a way that
is robust to the peculiarities of the marginal distributions.
- Abstract(参考訳): 集団合成は、行動モデルとシミュレーションのために、標的とするマイクロエージェントの集団を合成するが現実的に表現する。
本稿では,コピュラスに基づく新しい枠組みを導入し,類似の辺縁関係を持つ別の個体群からのサンプルを用いて,経験的辺縁分布のみが知られている対象個体群のための合成データを生成する。
これにより、人口合成の発生に空間的要素を組み込むことができ、様々な情報ソースを組み合わせてより現実的な人口発生装置を得ることができる。
具体的には,データを正規化し,与えられたコプラの実現として扱うとともに,正規化データ上で生成モデルを訓練し,限界値に関する情報を注入する。
我々は、コプラフレームワークをIPFやベイジアンネットワーク、変分オートエンコーダ、生成的対向ネットワークといった現代の確率論的アプローチと比較する。
また,アメリカのコミュニティ調査データを用いて,異なる地理的レベルでのデータ構造を,境界分布の特異性にロバストな方法で研究できることを明らかにした。
関連論文リスト
- A Deep Generative Framework for Joint Households and Individuals Population Synthesis [0.562479170374811]
世帯・個人・個人・個人関係を持つ合成集団を創出するための深い生成枠組みを提案する。
米国デラウェア州での申請の結果は、生成された家庭内レコードのリアリズムを確実にする能力を示している。
論文 参考訳(メタデータ) (2024-06-30T23:01:58Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Estimating Unknown Population Sizes Using the Hypergeometric Distribution [1.03590082373586]
総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。
本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。
実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-22T01:53:56Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - VFedMH: Vertical Federated Learning for Training Multiple Heterogeneous
Models [53.30484242706966]
本稿では,複数の異種モデル(VFedMH)を学習するための垂直フェデレーション学習という新しい手法を提案する。
被験者の局所的な埋め込み値を保護するために,軽量なブラインド・ファクターに基づく埋め込み保護手法を提案する。
実験により、VFedMHは、不均一な最適化で複数の異種モデルを同時に訓練し、モデル性能の最近の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-10-20T09:22:51Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Improving Heterogeneous Model Reuse by Density Estimation [105.97036205113258]
本稿では,異なる参加者の個人データを用いてモデルを学習することを目的とした多人数学習について検討する。
モデルの再利用は、各パーティーのためにローカルモデルがトレーニングされていると仮定して、マルチパーティの学習にとって有望なソリューションである。
論文 参考訳(メタデータ) (2023-05-23T09:46:54Z) - Heterogeneous Datasets for Federated Survival Analysis Simulation [6.489759672413373]
本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。
具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。
提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
論文 参考訳(メタデータ) (2023-01-28T11:37:07Z) - Robustness Analysis of Deep Learning Models for Population Synthesis [5.9106199000537645]
複数のデータセットに対するロバスト性を評価するため, 深部生成モデルのブートストラップ信頼区間を示す。
これらのモデルは、2008年、2013年、2018年のモントリオール・オリジン・デスチネーション・サーベイの複数の旅行日記に実装されている。
その結果,CTGANの予測誤差は,複数のデータセットに対する堅牢性を示す信頼区間が狭かった。
論文 参考訳(メタデータ) (2022-11-23T22:55:55Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z) - Composite Travel Generative Adversarial Networks for Tabular and
Sequential Population Synthesis [5.259027520298188]
本稿では,人口の関節分布を推定するためにCTGAN(Composite Travel Generative Adversarial Network)を提案する。
CTGANモデルは、変分オートエンコーダ(VAE)法など、最近提案された他の手法と比較される。
論文 参考訳(メタデータ) (2020-04-15T00:06:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。