論文の概要: Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification
- arxiv url: http://arxiv.org/abs/2305.18671v2
- Date: Tue, 13 Feb 2024 22:44:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-15 19:59:01.343640
- Title: Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification
- Title(参考訳): 摂動支援サンプル合成:不確実性定量の新しいアプローチ
- Authors: Yifei Liu, Rex Shen, and Xiaotong Shen
- Abstract要約: 本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。
我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
- 参考スコア(独自算出の注目度): 3.175239447683357
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces a novel Perturbation-Assisted Inference (PAI) framework
utilizing synthetic data generated by the Perturbation-Assisted Sample
Synthesis (PASS) method. The framework focuses on uncertainty quantification in
complex data scenarios, particularly involving unstructured data while
utilizing deep learning models. On one hand, PASS employs a generative model to
create synthetic data that closely mirrors raw data while preserving its rank
properties through data perturbation, thereby enhancing data diversity and
bolstering privacy. By incorporating knowledge transfer from large pre-trained
generative models, PASS enhances estimation accuracy, yielding refined
distributional estimates of various statistics via Monte Carlo experiments. On
the other hand, PAI boasts its statistically guaranteed validity. In pivotal
inference, it enables precise conclusions even without prior knowledge of the
pivotal's distribution. In non-pivotal situations, we enhance the reliability
of synthetic data generation by training it with an independent holdout sample.
We demonstrate the effectiveness of PAI in advancing uncertainty quantification
in complex, data-driven tasks by applying it to diverse areas such as image
synthesis, sentiment word analysis, multimodal inference, and the construction
of prediction intervals.
- Abstract(参考訳): 本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは複雑なデータシナリオにおける不確実性の定量化に焦点を当てている。
一方、PASSは生成モデルを用いて、データ摂動によってランク特性を保ちながら生データを密接に反映した合成データを作成し、データの多様性を高め、プライバシを高める。
大きな事前学習された生成モデルからの知識伝達を組み込むことで、passは推定精度を高め、モンテカルロ実験を通じて様々な統計の洗練された分布推定をもたらす。
一方、PAIは統計的に保証された妥当性を誇っている。
ピボット推論では、ピボット分布の事前の知識がなくても正確な結論を得られる。
非ピボタルな状況では、独立したホールドアウトサンプルで学習することで、合成データ生成の信頼性を高める。
本研究では,画像合成,感情語解析,マルチモーダル推論,予測区間の構築といった様々な分野に適用することにより,複雑なデータ駆動タスクにおける不確実性定量化の進展におけるpaiの有効性を実証する。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Conformalised data synthesis with statistical quality guarantees [0.0]
データ合成は、データハングリーモデルの需要に対応するための有望な技術である。
しかし、「合成器」モデルの出力の品質を確実に評価することは、オープンな研究課題である。
我々は統計的信頼性を保証するユニークな自信データ合成アルゴリズムを設計した。
論文 参考訳(メタデータ) (2023-12-14T14:44:08Z) - The Real Deal Behind the Artificial Appeal: Inferential Utility of Tabular Synthetic Data [40.165159490379146]
評価値が不偏であっても, 偽陽性の発見率(タイプ1の誤り)は不可避的に高いことが示唆された。
以前提案された補正係数が使用されているにもかかわらず、この問題は深層生成モデルに対して持続する。
論文 参考訳(メタデータ) (2023-12-13T02:04:41Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Towards Synthetic Multivariate Time Series Generation for Flare
Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。
本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文 参考訳(メタデータ) (2021-05-16T22:23:23Z) - Transitioning from Real to Synthetic data: Quantifying the bias in model [1.6134566438137665]
本研究では,合成データを用いたモデルにおけるバイアスと公平性のトレードオフを確立することを目的とする。
合成データを用いて訓練したモデルには、様々なレベルのバイアスの影響があることを実証する。
論文 参考訳(メタデータ) (2021-05-10T06:57:14Z) - Foundations of Bayesian Learning from Synthetic Data [1.6249267147413522]
我々はベイズパラダイムを用いて、合成データから学習する際のモデルパラメータの更新を特徴付ける。
ベイジアン・アップデートの最近の成果は、決定理論に基づく新しい、堅牢な合成学習のアプローチを支持している。
論文 参考訳(メタデータ) (2020-11-16T21:49:17Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。