論文の概要: Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification
- arxiv url: http://arxiv.org/abs/2305.18671v1
- Date: Tue, 30 May 2023 01:01:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 18:58:26.449271
- Title: Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification
- Title(参考訳): 摂動支援サンプル合成:不確実性定量の新しいアプローチ
- Authors: Yifei Liu, Rex Shen, and Xiaotong Shen
- Abstract要約: 摂動支援サンプル合成(PASS)は複雑なデータから信頼できる結論を生成する。
PASSを基盤として,摂動支援推論(PAI)と呼ばれる生成推論フレームワークを提案する。
ピボット推論では、PAIは、限られたデータであってもシミュレーションのようにピボットの分布を知ることなく正確な結論を可能にする。
- 参考スコア(独自算出の注目度): 3.742520285515209
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces a novel generator called Perturbation-Assisted Sample
Synthesis (PASS), designed for drawing reliable conclusions from complex data,
especially when using advanced modeling techniques like deep neural networks.
PASS utilizes perturbation to generate synthetic data that closely mirrors the
distribution of raw data, encompassing numerical and unstructured data types
such as gene expression, images, and text. By estimating the data-generating
distribution and leveraging large pre-trained generative models, PASS enhances
estimation accuracy, providing an estimated distribution of any statistic
through Monte Carlo experiments. Building on PASS, we propose a generative
inference framework called Perturbation-Assisted Inference (PAI), which offers
a statistical guarantee of validity. In pivotal inference, PAI enables accurate
conclusions without knowing a pivotal's distribution as in simulations, even
with limited data. In non-pivotal situations, we train PASS using an
independent holdout sample, resulting in credible conclusions. To showcase
PAI's capability in tackling complex problems, we highlight its applications in
three domains: image synthesis inference, sentiment word inference, and
multimodal inference via stable diffusion.
- Abstract(参考訳): 本稿では,特にディープニューラルネットワークなどの高度なモデリング技術を用いて,複雑なデータから信頼できる結論を導き出すために設計された,摂動支援サンプル合成(pass)と呼ばれる新しい生成器を提案する。
passは摂動を利用して生データの分布を密接に反映し、遺伝子発現、画像、テキストなどの数値的、非構造化データ型を包含する合成データを生成する。
データ生成分布を推定し、大きな事前学習された生成モデルを活用することにより、PASSは推定精度を高め、モンテカルロの実験を通して統計分布を推定する。
PASSをベースとしたPAI(Perturbation-Assisted Inference, 摂動支援推論)と呼ばれる生成推論フレームワークを提案する。
ピボット推論では、PAIは、限られたデータであってもシミュレーションのようにピボットの分布を知ることなく正確な結論を可能にする。
非ピボタルな状況では、独立したホールドアウトサンプルを用いてPASSを訓練し、信頼できる結論をもたらす。
PAIの複雑な問題に対処する能力を示すために、画像合成推論、感情語推論、安定拡散によるマルチモーダル推論という3つの領域での応用を強調した。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Conformalised data synthesis with statistical quality guarantees [0.0]
データ合成は、データハングリーモデルの需要に対応するための有望な技術である。
しかし、「合成器」モデルの出力の品質を確実に評価することは、オープンな研究課題である。
我々は統計的信頼性を保証するユニークな自信データ合成アルゴリズムを設計した。
論文 参考訳(メタデータ) (2023-12-14T14:44:08Z) - The Real Deal Behind the Artificial Appeal: Inferential Utility of Tabular Synthetic Data [40.165159490379146]
評価値が不偏であっても, 偽陽性の発見率(タイプ1の誤り)は不可避的に高いことが示唆された。
以前提案された補正係数が使用されているにもかかわらず、この問題は深層生成モデルに対して持続する。
論文 参考訳(メタデータ) (2023-12-13T02:04:41Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Towards Synthetic Multivariate Time Series Generation for Flare
Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。
本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文 参考訳(メタデータ) (2021-05-16T22:23:23Z) - Transitioning from Real to Synthetic data: Quantifying the bias in model [1.6134566438137665]
本研究では,合成データを用いたモデルにおけるバイアスと公平性のトレードオフを確立することを目的とする。
合成データを用いて訓練したモデルには、様々なレベルのバイアスの影響があることを実証する。
論文 参考訳(メタデータ) (2021-05-10T06:57:14Z) - Foundations of Bayesian Learning from Synthetic Data [1.6249267147413522]
我々はベイズパラダイムを用いて、合成データから学習する際のモデルパラメータの更新を特徴付ける。
ベイジアン・アップデートの最近の成果は、決定理論に基づく新しい、堅牢な合成学習のアプローチを支持している。
論文 参考訳(メタデータ) (2020-11-16T21:49:17Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。