論文の概要: Statistical Guarantees in Synthetic Data through Conformal Adversarial Generation
- arxiv url: http://arxiv.org/abs/2504.17058v2
- Date: Fri, 25 Apr 2025 19:52:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.150696
- Title: Statistical Guarantees in Synthetic Data through Conformal Adversarial Generation
- Title(参考訳): 共形逆数生成による合成データの統計的保証
- Authors: Rahul Vishwakarma, Shrey Dharmendra Modi, Vishwanath Seshagiri,
- Abstract要約: 既存の生成モデルは魅力的な合成サンプルを生成するが、基礎となるデータ分布との関係に関する厳密な統計的保証は欠如している。
本稿では,共形予測手法をGAN(Generative Adrial Networks)に組み込んだ新しいフレームワークを提案する。
このアプローチは、CGAN(Conformalized GAN)と呼ばれ、従来のGANの生成能力を維持しながら、キャリブレーション特性の強化を示す。
- 参考スコア(独自算出の注目度): 1.3654846342364308
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The generation of high-quality synthetic data presents significant challenges in machine learning research, particularly regarding statistical fidelity and uncertainty quantification. Existing generative models produce compelling synthetic samples but lack rigorous statistical guarantees about their relation to the underlying data distribution, limiting their applicability in critical domains requiring robust error bounds. We address this fundamental limitation by presenting a novel framework that incorporates conformal prediction methodologies into Generative Adversarial Networks (GANs). By integrating multiple conformal prediction paradigms including Inductive Conformal Prediction (ICP), Mondrian Conformal Prediction, Cross-Conformal Prediction, and Venn-Abers Predictors, we establish distribution-free uncertainty quantification in generated samples. This approach, termed Conformalized GAN (cGAN), demonstrates enhanced calibration properties while maintaining the generative power of traditional GANs, producing synthetic data with provable statistical guarantees. We provide rigorous mathematical proofs establishing finite-sample validity guarantees and asymptotic efficiency properties, enabling the reliable application of synthetic data in high-stakes domains including healthcare, finance, and autonomous systems.
- Abstract(参考訳): 高品質な合成データの生成は、特に統計的忠実度と不確かさの定量化に関して、機械学習研究において大きな課題を呈している。
既存の生成モデルは、魅力的な合成サンプルを生成するが、基礎となるデータ分布との関係に関する厳密な統計的保証が欠如しており、堅牢なエラー境界を必要とする臨界領域における適用性が制限されている。
本稿では,共形予測手法をGAN(Generative Adversarial Networks)に組み込んだ新しいフレームワークを提案する。
Inductive Conformal Prediction (ICP)、Mondrian Conformal Prediction、Cross-Conformal Prediction、Venn-Abers Predictorsを含む複数の共形予測パラダイムを統合することにより、生成したサンプルに分布のない不確実性定量化を確立する。
このアプローチは、CGAN(Conformalized GAN)と呼ばれ、従来のGANの生成能力を維持しながらキャリブレーション特性を向上し、証明可能な統計的保証を持つ合成データを生成する。
本稿では, 医療, 金融, 自律システムなどの高度領域において, 合成データの信頼性の高い適用を可能にする, 有限サンプル妥当性保証と漸近的効率性を確立する厳密な数学的証明を提供する。
関連論文リスト
- Conditional Data Synthesis Augmentation [4.3108820946281945]
Conditional Data Synthesis Augmentation (CoDSA)は、マルチモーダルドメイン間のモデルパフォーマンスを改善するために高忠実度データを合成する新しいフレームワークである。
合成データの現実性を高め,スパース領域の試料密度を高めるために,CoDSAファインチューン事前学習生成モデルを構築した。
本稿では,合成サンプル量と対象領域割り当ての関数として,CoDSAが実現した統計的精度向上を定量化する理論的枠組みを提案する。
論文 参考訳(メタデータ) (2025-04-10T03:38:11Z) - Partial Transportability for Domain Generalization [56.37032680901525]
本稿では, 部分的同定と輸送可能性の理論に基づいて, 対象分布の関数値の有界化に関する新たな結果を紹介する。
我々の貢献は、輸送可能性問題に対する最初の一般的な評価手法を提供することである。
本稿では,スケーラブルな推論を実現するための勾配に基づく最適化手法を提案する。
論文 参考訳(メタデータ) (2025-03-30T22:06:37Z) - Noise-Adaptive Conformal Classification with Marginal Coverage [53.74125453366155]
本稿では,ランダムラベルノイズによる交換性からの偏差を効率的に処理できる適応型共形推論手法を提案する。
本手法は,合成および実データに対して,その有効性を示す広範囲な数値実験により検証する。
論文 参考訳(メタデータ) (2025-01-29T23:55:23Z) - Generative Conformal Prediction with Vectorized Non-Conformity Scores [6.059745771017814]
コンフォーマル予測は、保証されたカバレッジでモデルに依存しない不確実性定量化を提供する。
ベクトル化された非整合性スコアを持つ生成共形予測フレームワークを提案する。
我々は密度ランクの不確かさ球を用いた適応不確かさ集合を構築する。
論文 参考訳(メタデータ) (2024-10-17T16:37:03Z) - Conformal Generative Modeling with Improved Sample Efficiency through Sequential Greedy Filtering [55.15192437680943]
生成モデルは出力に対する厳密な統計的保証を欠いている。
厳密な統計的保証を満たす予測セットを生成する逐次共形予測法を提案する。
このことは、高い確率で予測セットが少なくとも1つの許容可能な(または有効な)例を含むことを保証している。
論文 参考訳(メタデータ) (2024-10-02T15:26:52Z) - Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-07-01T20:44:48Z) - From Conformal Predictions to Confidence Regions [1.4272411349249627]
モデルパラメータに対する信頼領域を確立するために,モデル出力に共形予測間隔を組み合わせたCCRを導入する。
本稿では,雑音に対する最小限の仮定の下でのカバレッジ保証について述べる。
本手法は, 完全あるいはクロスコンフォーマルなアプローチを含む, 分割共形予測とブラックボックス手法の両方に適用可能である。
論文 参考訳(メタデータ) (2024-05-28T21:33:12Z) - Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification [3.175239447683357]
本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。
我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
論文 参考訳(メタデータ) (2023-05-30T01:01:36Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Decomposed Adversarial Learned Inference [118.27187231452852]
我々は,DALI(Decomposed Adversarial Learned Inference)という新しいアプローチを提案する。
DALIは、データ空間とコード空間の両方の事前および条件分布を明示的に一致させる。
MNIST, CIFAR-10, CelebAデータセットにおけるDALIの有効性を検証する。
論文 参考訳(メタデータ) (2020-04-21T20:00:35Z) - Distribution Approximation and Statistical Estimation Guarantees of
Generative Adversarial Networks [82.61546580149427]
GAN(Generative Adversarial Networks)は教師なし学習において大きな成功を収めている。
本稿では,H'older空間における密度データ分布推定のためのGANの近似と統計的保証を提供する。
論文 参考訳(メタデータ) (2020-02-10T16:47:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。