Fugu-MT 論文翻訳(概要): Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty Quantification

論文の概要: Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty Quantification

arxiv url: http://arxiv.org/abs/2305.18671v2
Date: Tue, 13 Feb 2024 22:44:31 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-15 19:59:01.343640
Title: Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty Quantification
Title（参考訳）: 摂動支援サンプル合成:不確実性定量の新しいアプローチ
Authors: Yifei Liu, Rex Shen, and Xiaotong Shen
Abstract要約: 本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
参考スコア（独自算出の注目度）: 3.175239447683357
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper introduces a novel Perturbation-Assisted Inference (PAI) framework utilizing synthetic data generated by the Perturbation-Assisted Sample Synthesis (PASS) method. The framework focuses on uncertainty quantification in complex data scenarios, particularly involving unstructured data while utilizing deep learning models. On one hand, PASS employs a generative model to create synthetic data that closely mirrors raw data while preserving its rank properties through data perturbation, thereby enhancing data diversity and bolstering privacy. By incorporating knowledge transfer from large pre-trained generative models, PASS enhances estimation accuracy, yielding refined distributional estimates of various statistics via Monte Carlo experiments. On the other hand, PAI boasts its statistically guaranteed validity. In pivotal inference, it enables precise conclusions even without prior knowledge of the pivotal's distribution. In non-pivotal situations, we enhance the reliability of synthetic data generation by training it with an independent holdout sample. We demonstrate the effectiveness of PAI in advancing uncertainty quantification in complex, data-driven tasks by applying it to diverse areas such as image synthesis, sentiment word analysis, multimodal inference, and the construction of prediction intervals.
Abstract（参考訳）: 本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。このフレームワークは複雑なデータシナリオにおける不確実性の定量化に焦点を当てている。一方、PASSは生成モデルを用いて、データ摂動によってランク特性を保ちながら生データを密接に反映した合成データを作成し、データの多様性を高め、プライバシを高める。大きな事前学習された生成モデルからの知識伝達を組み込むことで、passは推定精度を高め、モンテカルロ実験を通じて様々な統計の洗練された分布推定をもたらす。一方、PAIは統計的に保証された妥当性を誇っている。ピボット推論では、ピボット分布の事前の知識がなくても正確な結論を得られる。非ピボタルな状況では、独立したホールドアウトサンプルで学習することで、合成データ生成の信頼性を高める。本研究では,画像合成,感情語解析,マルチモーダル推論,予測区間の構築といった様々な分野に適用することにより,複雑なデータ駆動タスクにおける不確実性定量化の進展におけるpaiの有効性を実証する。

関連論文リスト

Uncertainty-Aware Data-Efficient AI: An Information-Theoretic Perspective [48.073471560778984]
ロボット工学、電気通信、医療といったコンテキスト固有のアプリケーションでは、人工知能システムは訓練データに制限があるという課題に直面していることが多い。本稿では,2つの相補的手法を用いて,データ制限体制に対処する形式的手法について検討する。
論文参考訳（メタデータ） (2025-12-04T21:44:22Z)
Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference [89.5628648718851]
因果推論は医療介入の開発と評価に不可欠である。現実の医療データセットは、規制障壁のためアクセスが難しいことが多い。本稿では,医学における治療効果分析のための新しい合成データ生成法STEAMを提案する。
論文参考訳（メタデータ） (2025-10-21T16:16:00Z)
Statistical Inference Leveraging Synthetic Data with Distribution-Free Guarantees [27.512077526249524]
高品質な合成データは、統計的推測の機会と課題の両方を提示する。本稿では,任意の統計的推論手順をラップするGEneral Synthetic-Powered Inferenceフレームワークを提案する。我々のフレームワークは、高品質な合成データを活用して統計的パワーを向上するが、実際のデータのみを用いて標準推論法に適応的にデフォルトとする。
論文参考訳（メタデータ） (2025-09-24T17:37:14Z)
Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文参考訳（メタデータ） (2025-06-13T15:27:40Z)
Synthetic-Powered Predictive Inference [28.99972786873634]
合成駆動予測推論(SPI) 非整合性のスコアを信頼された実データと合成データと整合させる経験的量子化マッピング。合成拡散モデル生成画像を用いた画像分類実験は、データスカース設定における予測効率の顕著な改善を示している。
論文参考訳（メタデータ） (2025-05-19T17:55:56Z)
Conditional Data Synthesis Augmentation [4.3108820946281945]
Conditional Data Synthesis Augmentation (CoDSA)は、マルチモーダルドメイン間のモデルパフォーマンスを改善するために高忠実度データを合成する新しいフレームワークである。合成データの現実性を高め,スパース領域の試料密度を高めるために,CoDSAファインチューン事前学習生成モデルを構築した。本稿では,合成サンプル量と対象領域割り当ての関数として,CoDSAが実現した統計的精度向上を定量化する理論的枠組みを提案する。
論文参考訳（メタデータ） (2025-04-10T03:38:11Z)
A Generalized Theory of Mixup for Structure-Preserving Synthetic Data [2.184775414778289]
混合は分散などの重要な統計特性を歪め、データ合成において意図しない結果をもたらす可能性があることを示す。一般化されたフレキシブルな重み付け方式を取り入れた新しい混合手法を提案し,元のデータ構造をよりよく保存する。数値実験により、新しい手法は元のデータの統計特性を保存できるだけでなく、繰り返し合成するモデル性能も維持できることを確認した。
論文参考訳（メタデータ） (2025-03-03T14:28:50Z)
A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.07063067759609]
高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文参考訳（メタデータ） (2025-02-26T06:18:13Z)
Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文参考訳（メタデータ） (2024-11-24T04:56:45Z)
Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文参考訳（メタデータ） (2024-02-19T02:08:09Z)
The Risk of Federated Learning to Skew Fine-Tuning Features and Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。 3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文参考訳（メタデータ） (2024-01-25T09:18:51Z)
Conformalised data synthesis with statistical quality guarantees [0.0]
データ合成は、データハングリーモデルの需要に対応するための有望な技術である。しかし、「合成器」モデルの出力の品質を確実に評価することは、オープンな研究課題である。我々は統計的信頼性を保証するユニークな自信データ合成アルゴリズムを設計した。
論文参考訳（メタデータ） (2023-12-14T14:44:08Z)
The Real Deal Behind the Artificial Appeal: Inferential Utility of Tabular Synthetic Data [40.165159490379146]
評価値が不偏であっても, 偽陽性の発見率(タイプ1の誤り)は不可避的に高いことが示唆された。以前提案された補正係数が使用されているにもかかわらず、この問題は深層生成モデルに対して持続する。
論文参考訳（メタデータ） (2023-12-13T02:04:41Z)
Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文参考訳（メタデータ） (2023-05-16T07:30:29Z)
CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文参考訳（メタデータ） (2022-03-03T05:58:49Z)
Towards Synthetic Multivariate Time Series Generation for Flare Forecasting [5.098461305284216]
データ駆動・レアイベント予測アルゴリズムのトレーニングにおける制限要因の1つは、関心のあるイベントの不足である。本研究では,データインフォームド・オーバーサンプリングを行う手段として,条件付き生成逆数ネットワーク(CGAN)の有用性を検討する。
論文参考訳（メタデータ） (2021-05-16T22:23:23Z)
Transitioning from Real to Synthetic data: Quantifying the bias in model [1.6134566438137665]
本研究では,合成データを用いたモデルにおけるバイアスと公平性のトレードオフを確立することを目的とする。合成データを用いて訓練したモデルには、様々なレベルのバイアスの影響があることを実証する。
論文参考訳（メタデータ） (2021-05-10T06:57:14Z)
Foundations of Bayesian Learning from Synthetic Data [1.6249267147413522]
我々はベイズパラダイムを用いて、合成データから学習する際のモデルパラメータの更新を特徴付ける。ベイジアン・アップデートの最近の成果は、決定理論に基づく新しい、堅牢な合成学習のアプローチを支持している。
論文参考訳（メタデータ） (2020-11-16T21:49:17Z)
Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2020-06-08T07:01:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。