論文の概要: Copula-based synthetic population generation
- arxiv url: http://arxiv.org/abs/2302.09193v1
- Date: Fri, 17 Feb 2023 23:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 20:00:22.558529
- Title: Copula-based synthetic population generation
- Title(参考訳): コプラ型人工集団発生
- Authors: Pascal Jutras-Dub\'e, Mohammad B. Al-Khasawneh, Zhichao Yang, Javier
Bas, Fabian Bastin and Cinzia Cirillo
- Abstract要約: 対象集団のための合成データを生成するためのコプラに基づく新しいフレームワークを提案する。
データを正規化し、与えられたコプラの実現として扱う。
我々は,正規化データから生成モデルを訓練し,限界値に関する情報を注入する。
- 参考スコア(独自算出の注目度): 0.2376767664163658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Population synthesis consists of generating synthetic but realistic
representations of a target population of micro-agents for the purpose of
behavioral modeling and simulation. We introduce a new framework based on
copulas to generate synthetic data for a target population of which only the
empirical marginal distributions are known by using a sample from another
population sharing similar marginal dependencies. This makes it possible to
include a spatial component in the generation of population synthesis and to
combine various sources of information to obtain more realistic population
generators. Specifically, we normalize the data and treat them as realizations
of a given copula, and train a generative model on the normalized data before
injecting the information on the marginals. We compare the copulas framework to
IPF and to modern probabilistic approaches such as Bayesian networks,
variational auto-encoders, and generative adversarial networks. We also
illustrate on American Community Survey data that the method proposed allows to
study the structure of the data at different geographical levels in a way that
is robust to the peculiarities of the marginal distributions.
- Abstract(参考訳): 集団合成は、行動モデルとシミュレーションのために、標的とするマイクロエージェントの集団を合成するが現実的に表現する。
本稿では,コピュラスに基づく新しい枠組みを導入し,類似の辺縁関係を持つ別の個体群からのサンプルを用いて,経験的辺縁分布のみが知られている対象個体群のための合成データを生成する。
これにより、人口合成の発生に空間的要素を組み込むことができ、様々な情報ソースを組み合わせてより現実的な人口発生装置を得ることができる。
具体的には,データを正規化し,与えられたコプラの実現として扱うとともに,正規化データ上で生成モデルを訓練し,限界値に関する情報を注入する。
我々は、コプラフレームワークをIPFやベイジアンネットワーク、変分オートエンコーダ、生成的対向ネットワークといった現代の確率論的アプローチと比較する。
また,アメリカのコミュニティ調査データを用いて,異なる地理的レベルでのデータ構造を,境界分布の特異性にロバストな方法で研究できることを明らかにした。
関連論文リスト
- Estimating Unknown Population Sizes Using the Hypergeometric
Distribution [1.223779595809275]
総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。
本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。
実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-22T01:53:56Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Combining propensity score methods with variational autoencoders for
generating synthetic data in presence of latent sub-groups [0.0]
ヘテロジニティは、例えば、サブグループラベルによって示されるように知られ、あるいは未知であり、双曲性や歪みのような分布の性質にのみ反映されるかもしれない。
本研究では,変分オートエンコーダ(VAE)から合成データを取得する際に,このような異種性をどのように保存し,制御するかを検討する。
論文 参考訳(メタデータ) (2023-12-12T22:49:24Z) - PFL-GAN: When Client Heterogeneity Meets Generative Models in
Personalized Federated Learning [55.930403371398114]
パーソナライズドラーニング(PFL)のための新しいGAN(Generative Adversarial Network)の共有と集約戦略を提案する。
PFL-GANは、異なるシナリオにおけるクライアントの不均一性に対処する。より具体的には、まずクライアント間の類似性を学び、次に重み付けされた協調データアグリゲーションを開発する。
いくつかのよく知られたデータセットに対する厳密な実験による実験結果は、PFL-GANの有効性を示している。
論文 参考訳(メタデータ) (2023-08-23T22:38:35Z) - Tackling Computational Heterogeneity in FL: A Few Theoretical Insights [68.8204255655161]
我々は、計算異種データの形式化と処理を可能にする新しい集約フレームワークを導入し、分析する。
提案するアグリゲーションアルゴリズムは理論的および実験的予測から広範囲に解析される。
論文 参考訳(メタデータ) (2023-07-12T16:28:21Z) - GenSyn: A Multi-stage Framework for Generating Synthetic Microdata using
Macro Data Sources [21.32471030724983]
人口を特徴付ける個人レベルのデータ(マイクロデータ)は多くの現実世界の問題を研究するのに不可欠である。
本研究では,高分解能データの抽出方法として合成データ生成について検討する。
論文 参考訳(メタデータ) (2022-12-08T01:22:12Z) - Towards Understanding and Mitigating Dimensional Collapse in
Heterogeneous Federated Learning [114.32726625370258]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Partially Conditioned Generative Adversarial Networks [75.08725392017698]
Generative Adversarial Networks (GAN)は、実世界のトレーニングデータセットの基盤となる確率分布を暗黙的にモデル化することで、人工データセットを合成する。
条件付きGANとその変種の導入により、これらの手法はデータセット内の各サンプルで利用可能な補助情報に基づいて条件付きサンプルを生成するように拡張された。
本研究では,標準条件付きGANがそのようなタスクに適さないことを論じ,新たなAdversarial Networkアーキテクチャとトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-07-06T15:59:28Z) - Composite Travel Generative Adversarial Networks for Tabular and
Sequential Population Synthesis [5.259027520298188]
本稿では,人口の関節分布を推定するためにCTGAN(Composite Travel Generative Adversarial Network)を提案する。
CTGANモデルは、変分オートエンコーダ(VAE)法など、最近提案された他の手法と比較される。
論文 参考訳(メタデータ) (2020-04-15T00:06:52Z) - GANs with Conditional Independence Graphs: On Subadditivity of
Probability Divergences [70.30467057209405]
GAN(Generative Adversarial Networks)は、データセットの基盤となる分布を学習するための現代的な手法である。
GANは、基礎となるディストリビューションに関する追加情報がないモデルフリーで設計されている。
本稿では,ベイズネット/MRFの近傍に単純な識別器群を用いたモデルベースGANの設計を提案する。
論文 参考訳(メタデータ) (2020-03-02T04:31:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。