論文の概要: Generating Feasible and Diverse Synthetic Populations Using Diffusion Models
- arxiv url: http://arxiv.org/abs/2508.09164v1
- Date: Wed, 06 Aug 2025 03:11:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.570492
- Title: Generating Feasible and Diverse Synthetic Populations Using Diffusion Models
- Title(参考訳): 拡散モデルを用いた可逆・可逆合成集団の生成
- Authors: Min Tang, Peng Lu, Qing Feng,
- Abstract要約: 集団合成は、人口の人工的かつ現実的な表現を生成することに関わる重要な課題である。
深層生成モデルは、実際の集団に存在するがサンプルデータには存在しない可能性のある属性の組み合わせを合成することができる。
本研究では,新しい拡散モデルに基づく集団合成法を提案し,その基礎となる集団の結合分布を推定する。
- 参考スコア(独自算出の注目度): 5.689443449061003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Population synthesis is a critical task that involves generating synthetic yet realistic representations of populations. It is a fundamental problem in agent-based modeling (ABM), which has become the standard to analyze intelligent transportation systems. The synthetic population serves as the primary input for ABM transportation simulation, with traveling agents represented by population members. However, when the number of attributes describing agents becomes large, survey data often cannot densely support the joint distribution of the attributes in the population due to the curse of dimensionality. This sparsity makes it difficult to accurately model and produce the population. Interestingly, deep generative models trained from available sample data can potentially synthesize possible attribute combinations that present in the actual population but do not exist in the sample data(called sampling zeros). Nevertheless, this comes at the cost of falsely generating the infeasible attribute combinations that do not exist in the population (called structural zeros). In this study, a novel diffusion model-based population synthesis method is proposed to estimate the underlying joint distribution of a population. This approach enables the recovery of numerous missing sampling zeros while keeping the generated structural zeros minimal. Our method is compared with other recently proposed approaches such as Variational Autoencoders (VAE) and Generative Adversarial Network (GAN) approaches, which have shown success in high dimensional tabular population synthesis. We assess the performance of the synthesized outputs using a range of metrics, including marginal distribution similarity, feasibility, and diversity. The results demonstrate that our proposed method outperforms previous approaches in achieving a better balance between the feasibility and diversity of the synthesized population.
- Abstract(参考訳): 集団合成は、人口の人工的かつ現実的な表現を生成することに関わる重要な課題である。
これはエージェント・ベース・モデリング(ABM)における基本的な問題であり、インテリジェント・トランスポート・システム分析の標準となっている。
合成人口は、ABM輸送シミュレーションの第一の入力として機能し、旅行エージェントは人口構成員によって代表される。
しかし, エージェントを記述した属性の数が大きくなると, 寸法の呪いによる集団の属性の共分散を, 調査データが密に支持できないことがしばしばある。
この空間は人口を正確にモデル化し生産することを困難にしている。
興味深いことに、利用可能なサンプルデータから訓練された深い生成モデルは、実際の集団に存在するがサンプルデータには存在しない可能性のある属性の組み合わせを合成することができる(サンプリングゼロと呼ばれる)。
それでもこれは、人口に存在しない非実用的属性の組み合わせ(構造ゼロと呼ばれる)を誤って生成するコストが伴う。
本研究では,新しい拡散モデルに基づく集団合成法を提案し,その基礎となる集団の結合分布を推定する。
このアプローチは、生成された構造零点を最小に保ちながら、多くの欠落したサンプリング零点の回復を可能にする。
本手法は,近年提案されている変分オートエンコーダ (VAE) やGAN (Generative Adversarial Network) などの手法と比較して,高次元の表層集団合成に成功している。
我々は,限界分布の類似性,実現可能性,多様性など,様々な指標を用いて,合成出力の性能を評価する。
提案手法は, 合成個体群の有効性と多様性のバランスを改善するために, 従来の手法よりも優れていることを示す。
関連論文リスト
- Deep and diverse population synthesis for multi-person households using generative models [4.321984653683312]
ニューヨーク州全体の合成人口を生成するために, 新規な人口合成モデルを適用した。
人口は約2000万人、世帯数は750万人である。
国勢調査の限界と比較すると、人工的な人口は17%の多様性を持つデータを提供している。
論文 参考訳(メタデータ) (2025-08-13T17:31:45Z) - Using Imperfect Synthetic Data in Downstream Inference Tasks [50.40949503799331]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を改善することができる。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Meta Flow Matching: Integrating Vector Fields on the Wasserstein Manifold [83.18058549195855]
自然科学における複数の過程は、確率密度のワッサーシュタイン多様体上のベクトル場として表さなければならない。
特に、疾患の発生とその治療反応が患者固有の細胞の微小環境に依存するパーソナライズド医療において重要である。
本稿では,初期個体群上の流れモデルを改善することで,ワッサーシュタイン多様体上のこれらのベクトル場と一体化するためのメタフローマッチング(MFM)を提案する。
論文 参考訳(メタデータ) (2024-08-26T20:05:31Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Combining propensity score methods with variational autoencoders for
generating synthetic data in presence of latent sub-groups [0.0]
ヘテロジニティは、例えば、サブグループラベルによって示されるように知られ、あるいは未知であり、双曲性や歪みのような分布の性質にのみ反映されるかもしれない。
本研究では,変分オートエンコーダ(VAE)から合成データを取得する際に,このような異種性をどのように保存し,制御するかを検討する。
論文 参考訳(メタデータ) (2023-12-12T22:49:24Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Copula-based transferable models for synthetic population generation [1.370096215615823]
集団合成は、マイクロエージェントの標的集団の合成的かつ現実的な表現を生成することを含む。
従来の手法は、しばしばターゲットのサンプルに依存し、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-17T23:58:14Z) - A Deep Generative Model for Feasible and Diverse Population Synthesis [0.0]
本研究では,サンプリングゼロを保存しながら構造零点を最小化する新しい手法を提案する。
DGMのトレーニングをカスタマイズするために2つの正規化が考案され、GAN(generative adversarial Network)とVAE(variantal autoencoder)に適用される。
その結果, 従来のモデルに比べて, 合成個体群の実現可能性や多様性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2022-08-01T05:02:02Z) - Composite Travel Generative Adversarial Networks for Tabular and
Sequential Population Synthesis [5.259027520298188]
本稿では,人口の関節分布を推定するためにCTGAN(Composite Travel Generative Adversarial Network)を提案する。
CTGANモデルは、変分オートエンコーダ(VAE)法など、最近提案された他の手法と比較される。
論文 参考訳(メタデータ) (2020-04-15T00:06:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。