論文の概要: Context-Conditioned Generative Models Enable Subnational Refinement of Sparse Humanitarian Surveys
- arxiv url: http://arxiv.org/abs/2605.31489v2
- Date: Thu, 04 Jun 2026 08:58:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 19:21:32.814376
- Title: Context-Conditioned Generative Models Enable Subnational Refinement of Sparse Humanitarian Surveys
- Title(参考訳): 余分な人道的サーベイの国の分断を可能にする文脈条件生成モデル
- Authors: Federica Sibilla, Vasiliki Voukelatou, Duccio Piovani, Kyriacos Koupparis, Daniela Paolotti, Rossano Schifanella, Kyriaki Kalimeri,
- Abstract要約: 我々は、複雑なデータ分布を学習し、文脈的特徴に基づいて条件付けできる生成モデルを評価する。
本研究では, 文脈条件付き生成モデルにより, 厳密なデータ不足下での国別調査分布を洗練できることを示す。
- 参考スコア(独自算出の注目度): 0.7943457288167796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data scarcity limits inference in many scientific and policy domains. Survey data are essential for decision-making, but sparse samples often fail to capture fine spatial granularities. We evaluate normalizing flows, a generative model that learns complex data distributions and can be conditioned on exogenous contextual features, in controlled data scarcity scenarios. Across eight household survey datasets spanning six low-income or middle-income countries in the humanitarian domain, we show that context-conditioned generative models can refine sub-national survey distributions under severe data scarcity, and that performance increases systematically with the richness of the conditioning information. These findings support a general principle for survey data augmentation: generative models can improve sub-national estimates when the sparse sample retains sufficient support and contextual covariates encode relevant local heterogeneity. By learning full conditional distributions rather than point estimates, the approach provides fine-grained evidence for humanitarian decision-making and resource allocation.
- Abstract(参考訳): データ不足は、多くの科学および政策分野における推論を制限する。
調査データは意思決定に不可欠であるが、スパースサンプルはしばしば細かな空間的な粒度を捉えない。
我々は、複雑なデータ分布を学習し、制御されたデータ不足のシナリオにおいて、外因性コンテキストの特徴を条件付けることができる生成モデルである正規化フローを評価する。
人道的領域の低所得国・中所得国にまたがる8つの世帯調査データセットにおいて、文脈条件付き生成モデルにより、厳密なデータ不足下で、サブ国の調査分布を洗練でき、条件情報の豊かさとともに、性能が体系的に向上することを示す。
生成モデルはスパースサンプルが十分な支持を維持し、関連する局所的不均一性をエンコードする文脈的共変量を持つ場合、サブ国家の推定を改善することができる。
点推定よりも完全な条件分布を学習することにより、人道的意思決定と資源配分の詳細な証拠を提供する。
関連論文リスト
- Reinforcement-Guided Synthetic Data Generation for Privacy-Sensitive Identity Recognition [60.52810518437911]
高忠実度生成モデルは、プライバシーに敏感なシナリオでますます必要とされている。
限られたデータによって生成モデルは貧弱になり、データ不足を軽減できない。
汎用ドメイン生成の先行を識別タスクに適応させる,強化誘導型合成データ生成フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-09T06:52:03Z) - Evidence-based Distributional Alignment for Large Language Models [58.65469623911573]
LLM分布推定の忠実度とロバスト性を改善する証拠に基づくアライメント手法であるEvi-DAを提案する。
対象国が与えられた場合、Evi-DAは関連するWorld Values Survey項目とその回答分布を検索し、オプション毎に粗いヴェルツェル値シグネチャを予測し、国条件の回答分布を構造化形式で推測する。
論文 参考訳(メタデータ) (2026-03-03T03:34:06Z) - Exact Synthetic Populations for Scalable Societal and Market Modeling [0.0]
ターゲット統計を高精度に再現する合成集団を生成するための制約プログラミングフレームワークを提案する。
本研究は, 人口統計資料へのアプローチを検証するとともに, 下流分析における分布偏差の影響について検討する。
論文 参考訳(メタデータ) (2025-12-08T08:48:21Z) - Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Generating Heterogeneous Multi-dimensional Data : A Comparative Study [3.4123736336071864]
ランダムサンプリング,タブラリ変分オートエンコーダ,標準生成逆数ネットワーク,条件付きタブラリ生成逆数ネットワーク,拡散確率モデルなどの手法について検討した。
このギャップに対処するために、消防ドメインに合わせて調整されたドメイン固有のメトリクスの組み合わせを用いて、合成データ品質の評価を行う。
論文 参考訳(メタデータ) (2025-06-30T09:43:23Z) - Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - A Likelihood Based Approach to Distribution Regression Using Conditional Deep Generative Models [8.862614615192578]
本研究では,条件付き深部生成モデルの推定のための可能性に基づくアプローチの大規模サンプル特性について検討する。
その結果,条件分布を推定するための最大極大推定器の収束率を導いた。
論文 参考訳(メタデータ) (2024-10-02T20:46:21Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - An Information-theoretic Approach to Distribution Shifts [9.475039534437332]
機械学習モデルを現実世界に安全にデプロイすることは、しばしば難しいプロセスである。
特定の地理的位置から得られたデータで訓練されたモデルは、他の場所で得られたデータでクエリされたときに失敗する傾向がある。
集団のサブセットに適合するニューラルネットワークは 選択バイアスを 与えるかもしれない
論文 参考訳(メタデータ) (2021-06-07T16:44:21Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。