Fugu-MT 論文翻訳(概要): Copula-based synthetic population generation

論文の概要: Copula-based synthetic population generation

arxiv url: http://arxiv.org/abs/2302.09193v1
Date: Fri, 17 Feb 2023 23:58:14 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-21 20:00:22.558529
Title: Copula-based synthetic population generation
Title（参考訳）: コプラ型人工集団発生
Authors: Pascal Jutras-Dub\'e, Mohammad B. Al-Khasawneh, Zhichao Yang, Javier Bas, Fabian Bastin and Cinzia Cirillo
Abstract要約: 対象集団のための合成データを生成するためのコプラに基づく新しいフレームワークを提案する。データを正規化し、与えられたコプラの実現として扱う。我々は,正規化データから生成モデルを訓練し,限界値に関する情報を注入する。
参考スコア（独自算出の注目度）: 0.2376767664163658
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Population synthesis consists of generating synthetic but realistic representations of a target population of micro-agents for the purpose of behavioral modeling and simulation. We introduce a new framework based on copulas to generate synthetic data for a target population of which only the empirical marginal distributions are known by using a sample from another population sharing similar marginal dependencies. This makes it possible to include a spatial component in the generation of population synthesis and to combine various sources of information to obtain more realistic population generators. Specifically, we normalize the data and treat them as realizations of a given copula, and train a generative model on the normalized data before injecting the information on the marginals. We compare the copulas framework to IPF and to modern probabilistic approaches such as Bayesian networks, variational auto-encoders, and generative adversarial networks. We also illustrate on American Community Survey data that the method proposed allows to study the structure of the data at different geographical levels in a way that is robust to the peculiarities of the marginal distributions.
Abstract（参考訳）: 集団合成は、行動モデルとシミュレーションのために、標的とするマイクロエージェントの集団を合成するが現実的に表現する。本稿では,コピュラスに基づく新しい枠組みを導入し,類似の辺縁関係を持つ別の個体群からのサンプルを用いて,経験的辺縁分布のみが知られている対象個体群のための合成データを生成する。これにより、人口合成の発生に空間的要素を組み込むことができ、様々な情報ソースを組み合わせてより現実的な人口発生装置を得ることができる。具体的には,データを正規化し,与えられたコプラの実現として扱うとともに,正規化データ上で生成モデルを訓練し,限界値に関する情報を注入する。我々は、コプラフレームワークをIPFやベイジアンネットワーク、変分オートエンコーダ、生成的対向ネットワークといった現代の確率論的アプローチと比較する。また,アメリカのコミュニティ調査データを用いて,異なる地理的レベルでのデータ構造を,境界分布の特異性にロバストな方法で研究できることを明らかにした。

関連論文リスト

Generating Feasible and Diverse Synthetic Populations Using Diffusion Models [5.689443449061003]
集団合成は、人口の人工的かつ現実的な表現を生成することに関わる重要な課題である。深層生成モデルは、実際の集団に存在するがサンプルデータには存在しない可能性のある属性の組み合わせを合成することができる。本研究では,新しい拡散モデルに基づく集団合成法を提案し,その基礎となる集団の結合分布を推定する。
論文参考訳（メタデータ） (2025-08-06T03:11:27Z)
Generating Heterogeneous Multi-dimensional Data : A Comparative Study [3.4123736336071864]
ランダムサンプリング,タブラリ変分オートエンコーダ,標準生成逆数ネットワーク,条件付きタブラリ生成逆数ネットワーク,拡散確率モデルなどの手法について検討した。このギャップに対処するために、消防ドメインに合わせて調整されたドメイン固有のメトリクスの組み合わせを用いて、合成データ品質の評価を行う。
論文参考訳（メタデータ） (2025-06-30T09:43:23Z)
Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文参考訳（メタデータ） (2025-05-26T16:05:10Z)
A Deep Generative Framework for Joint Households and Individuals Population Synthesis [0.562479170374811]
世帯・個人・個人・個人関係を持つ合成集団を創出するための深い生成枠組みを提案する。米国デラウェア州での申請の結果は、生成された家庭内レコードのリアリズムを確実にする能力を示している。
論文参考訳（メタデータ） (2024-06-30T23:01:58Z)
Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文参考訳（メタデータ） (2024-04-24T09:04:36Z)
Estimating Unknown Population Sizes Using the Hypergeometric Distribution [1.03590082373586]
総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文参考訳（メタデータ） (2024-02-22T01:53:56Z)
Synthetic location trajectory generation using categorical diffusion models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文参考訳（メタデータ） (2024-02-19T15:57:39Z)
VFedMH: Vertical Federated Learning for Training Multiple Heterogeneous Models [53.30484242706966]
本稿では,複数の異種モデル(VFedMH)を学習するための垂直フェデレーション学習という新しい手法を提案する。被験者の局所的な埋め込み値を保護するために,軽量なブラインド・ファクターに基づく埋め込み保護手法を提案する。実験により、VFedMHは、不均一な最適化で複数の異種モデルを同時に訓練し、モデル性能の最近の手法より優れていることを示す。
論文参考訳（メタデータ） (2023-10-20T09:22:51Z)
Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文参考訳（メタデータ） (2023-08-28T18:48:34Z)
Improving Heterogeneous Model Reuse by Density Estimation [105.97036205113258]
本稿では,異なる参加者の個人データを用いてモデルを学習することを目的とした多人数学習について検討する。モデルの再利用は、各パーティーのためにローカルモデルがトレーニングされていると仮定して、マルチパーティの学習にとって有望なソリューションである。
論文参考訳（メタデータ） (2023-05-23T09:46:54Z)
Heterogeneous Datasets for Federated Survival Analysis Simulation [6.489759672413373]
本研究では、既存の非フェデレーションデータセットから再現可能な方法で開始することで、現実的な異種データセットを構築する新しい手法を提案する。具体的には、ディリクレ分布に基づく2つの新しいデータセット分割アルゴリズムを提供し、各データサンプルを慎重に選択したクライアントに割り当てる。提案手法の実装は,フェデレートされた環境をシミュレートしてサバイバル分析を行うことを推奨し,広く普及している。
論文参考訳（メタデータ） (2023-01-28T11:37:07Z)
Robustness Analysis of Deep Learning Models for Population Synthesis [5.9106199000537645]
複数のデータセットに対するロバスト性を評価するため, 深部生成モデルのブートストラップ信頼区間を示す。これらのモデルは、2008年、2013年、2018年のモントリオール・オリジン・デスチネーション・サーベイの複数の旅行日記に実装されている。その結果,CTGANの予測誤差は,複数のデータセットに対する堅牢性を示す信頼区間が狭かった。
論文参考訳（メタデータ） (2022-11-23T22:55:55Z)
BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文参考訳（メタデータ） (2020-08-11T17:04:47Z)
Composite Travel Generative Adversarial Networks for Tabular and Sequential Population Synthesis [5.259027520298188]
本稿では,人口の関節分布を推定するためにCTGAN(Composite Travel Generative Adversarial Network)を提案する。 CTGANモデルは、変分オートエンコーダ(VAE)法など、最近提案された他の手法と比較される。
論文参考訳（メタデータ） (2020-04-15T00:06:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。