論文の概要: A Deep Generative Model for Feasible and Diverse Population Synthesis
- arxiv url: http://arxiv.org/abs/2208.01403v1
- Date: Mon, 1 Aug 2022 05:02:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 12:57:45.847283
- Title: A Deep Generative Model for Feasible and Diverse Population Synthesis
- Title(参考訳): 可能かつ多様な集団合成のための深部生成モデル
- Authors: Eui-Jin Kim and Prateek Bansal
- Abstract要約: 本研究では,サンプリングゼロを保存しながら構造零点を最小化する新しい手法を提案する。
DGMのトレーニングをカスタマイズするために2つの正規化が考案され、GAN(generative adversarial Network)とVAE(variantal autoencoder)に適用される。
その結果, 従来のモデルに比べて, 合成個体群の実現可能性や多様性が著しく向上していることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An ideal synthetic population, a key input to activity-based models, mimics
the distribution of the individual- and household-level attributes in the
actual population. Since the entire population's attributes are generally
unavailable, household travel survey (HTS) samples are used for population
synthesis. Synthesizing population by directly sampling from HTS ignores the
attribute combinations that are unobserved in the HTS samples but exist in the
population, called 'sampling zeros'. A deep generative model (DGM) can
potentially synthesize the sampling zeros but at the expense of generating
'structural zeros' (i.e., the infeasible attribute combinations that do not
exist in the population). This study proposes a novel method to minimize
structural zeros while preserving sampling zeros. Two regularizations are
devised to customize the training of the DGM and applied to a generative
adversarial network (GAN) and a variational autoencoder (VAE). The adopted
metrics for feasibility and diversity of the synthetic population indicate the
capability of generating sampling and structural zeros -- lower structural
zeros and lower sampling zeros indicate the higher feasibility and the lower
diversity, respectively. Results show that the proposed regularizations achieve
considerable performance improvement in feasibility and diversity of the
synthesized population over traditional models. The proposed VAE additionally
generated 23.5% of the population ignored by the sample with 79.2% precision
(i.e., 20.8% structural zeros rates), while the proposed GAN generated 18.3% of
the ignored population with 89.0% precision. The proposed improvement in DGM
generates a more feasible and diverse synthetic population, which is critical
for the accuracy of an activity-based model.
- Abstract(参考訳): 理想的な合成人口は、活動に基づくモデルへの重要な入力であり、実際の人口における個人および世帯レベルの属性の分布を模倣する。
人口全体の属性は一般に利用できないため、家庭旅行調査(HTS)サンプルが人口合成に使用されている。
HTSからの直接サンプリングによる集団の合成は、HTSサンプルでは観測されていないが、集団に存在する属性の組み合わせを無視している。
深層生成モデル(DGM)はサンプリングゼロを合成することができるが、「構造ゼロ」を生成するコスト(つまり、集団に存在しない非実用的属性の組み合わせ)がかかる。
本研究では,サンプリングゼロを保存しながら構造零点を最小化する新しい手法を提案する。
DGMのトレーニングをカスタマイズするために2つの正規化が考案され、GAN(generative adversarial network)とVAE(variantal autoencoder)に適用される。
人工個体群の実現可能性と多様性の指標は, サンプリングゼロと構造ゼロを生成する能力を示し, 低い構造ゼロと低いサンプリングゼロは, それぞれ高い実現可能性と低い多様性を示す。
その結果, 従来のモデルに比べて, 合成個体群の実現可能性や多様性が著しく向上することが示唆された。
提案されたVAEは79.2%の精度で無視された人口の23.5%(構造ゼロ率20.8%)を、提案されたGANは89.0%の精度で無視された人口の18.3%を発生させた。
提案されたdgmの改良は、より実現可能で多様な合成人口を生み出し、活動ベースのモデルの正確性に不可欠である。
関連論文リスト
- sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - Bt-GAN: Generating Fair Synthetic Healthdata via Bias-transforming Generative Adversarial Networks [3.3903891679981593]
本稿では,医療領域に特化して設計されたGANベースの合成データジェネレータであるBias-transforming Generative Adversarial Networks (Bt-GAN)について述べる。
以上の結果から,Bt-GANはSOTA精度を向上し,公平性とバイアスの最小化を図った。
論文 参考訳(メタデータ) (2024-04-21T12:16:38Z) - Combining propensity score methods with variational autoencoders for
generating synthetic data in presence of latent sub-groups [0.0]
ヘテロジニティは、例えば、サブグループラベルによって示されるように知られ、あるいは未知であり、双曲性や歪みのような分布の性質にのみ反映されるかもしれない。
本研究では,変分オートエンコーダ(VAE)から合成データを取得する際に,このような異種性をどのように保存し,制御するかを検討する。
論文 参考訳(メタデータ) (2023-12-12T22:49:24Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Reweighted Mixup for Subpopulation Shift [63.1315456651771]
サブポピュレーションシフトは、多くの実世界のアプリケーションに存在し、同じサブポピュレーショングループを含むが異なるサブポピュレーション比率を持つトレーニングとテストの分布を指す。
重要度再重み付けは、サブポピュレーションシフトを処理する古典的で効果的な方法である。
我々は、オーバーフィッティング問題を緩和するために、reweighted mixupと呼ばれるシンプルで実用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T03:44:50Z) - Tailoring Language Generation Models under Total Variation Distance [55.89964205594829]
ニューラルネットワーク生成の標準パラダイムは、最適化方法として最大推定(MLE)を採用する。
言語生成に適用するための実践的境界を開発する。
本稿では,TVD推定のトレードオフのバランスをとるためのTaiLr の目標について紹介する。
論文 参考訳(メタデータ) (2023-02-26T16:32:52Z) - Copula-based transferable models for synthetic population generation [1.370096215615823]
集団合成は、マイクロエージェントの標的集団の合成的かつ現実的な表現を生成することを含む。
従来の手法は、しばしばターゲットのサンプルに依存し、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-17T23:58:14Z) - Selectively increasing the diversity of GAN-generated samples [8.980453507536017]
本稿では,GAN生成サンプルの多様性を選択的に向上する手法を提案する。
本研究では,CERN における ALICE 実験のZero Degree Calorimeter から得られたデータをシミュレーションする実生活シナリオとともに,本手法の優位性を示す。
論文 参考訳(メタデータ) (2022-07-04T16:27:06Z) - Reparameterized Sampling for Generative Adversarial Networks [71.30132908130581]
本稿では,マルコフ連鎖をジェネレータの潜在空間に再配置することで,一般依存型提案を可能にする新しいサンプリング手法REP-GANを提案する。
実験的な実験により、我々のREP-GANはサンプル効率を大幅に改善し、同時により良いサンプル品質を得ることを示した。
論文 参考訳(メタデータ) (2021-07-01T10:34:55Z) - GANs with Variational Entropy Regularizers: Applications in Mitigating
the Mode-Collapse Issue [95.23775347605923]
深層学習の成功に基づいて、GAN(Generative Adversarial Networks)は、観測されたサンプルから確率分布を学習するための現代的なアプローチを提供する。
GANはしばしば、ジェネレータが入力分布の既存のすべてのモードをキャプチャできないモード崩壊問題に悩まされる。
情報理論のアプローチを採り、生成したサンプルのエントロピーの変動的下限を最大化し、それらの多様性を増大させる。
論文 参考訳(メタデータ) (2020-09-24T19:34:37Z) - Discriminator Contrastive Divergence: Semi-Amortized Generative Modeling
by Exploring Energy of the Discriminator [85.68825725223873]
GAN(Generative Adversarial Networks)は、高次元データのモデリングにおいて大きな可能性を秘めている。
本稿では,WGANの識別器の特性を活かした識別器コントラストの多様性について紹介する。
我々は、合成データと実世界の画像生成ベンチマークの両方において、大幅に改善された生成の利点を実証する。
論文 参考訳(メタデータ) (2020-04-05T01:50:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。