論文の概要: Valid Inference with Synthetic Data via Task Exchangeability
- arxiv url: http://arxiv.org/abs/2606.13629v1
- Date: Thu, 11 Jun 2026 17:41:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.959224
- Title: Valid Inference with Synthetic Data via Task Exchangeability
- Title(参考訳): タスク交換性による合成データによる妥当性推論
- Authors: Lezhi Tan, Tijana Zrnic,
- Abstract要約: 本研究では, 有効性保証を伴う科学研究における合成データの利用原理を提案する。
重要な洞察は、タスク交換可能性と呼ばれる新しい技術的条件です。
タスク交換可能性の下で有効な推論法を開発する。
- 参考スコア(独自算出の注目度): 10.492831277106403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is a proliferation of work arguing for the use of synthetic data in scientific research. For example, social scientists are arguing for the use of LLM-generated "silicon samples" in pilot studies; AI evaluations increasingly rely on "LLM-as-a-judge" outputs; and proteomics research is accelerated by generative models that produce synthetic protein structures. These developments raise an intriguing possibility: synthetic data may help researchers ask more questions, run more studies, and accelerate discovery. But they also raise a fundamental concern: synthetic data can be biased, noisy, and misspecified. In this work, we propose statistical principles for using synthetic data in scientific research with provable validity guarantees. The key insight is a new technical condition that we call task exchangeability. Informally, this is a requirement that the researcher can identify historical tasks, for which real data is available, such that their current task of interest is exchangeable with the historical tasks in an appropriate mathematical sense. We develop methods for valid inference under task exchangeability, together with extensions that provide guarantees even beyond exchangeability. We demonstrate the framework on public opinion surveys with silicon samples and AI evaluation with autoraters.
- Abstract(参考訳): 科学研究における合成データの利用を主張する研究が急増している。
例えば、社会科学者は、パイロット研究でLLMの生成した「シリコンサンプル」の使用について議論しており、AI評価は「LLM-as-a-judge」出力にますます依存しており、プロテオミクスの研究は合成タンパク質構造を生成する生成モデルによって加速されている。
合成データは、研究者がより多くの質問をしたり、より多くの研究をしたり、発見を加速したりするのに役立ちます。
合成データは偏りがあり、ノイズがあり、不特定である。
本研究では, 有効性保証を伴う科学的研究において, 合成データを用いた統計的原理を提案する。
重要な洞察は、タスク交換可能性と呼ばれる新しい技術的条件です。
これは、研究者が実際のデータが利用可能な歴史的タスクを識別し、現在の関心のあるタスクが適切な数学的意味において歴史的なタスクと交換可能であるように要求するものである。
タスク交換可能性の下で有効な推論方法と、交換可能性を超えた保証を提供する拡張を開発する。
シリコンサンプルを用いた世論調査とオートレーダによるAI評価のフレームワークを実演する。
関連論文リスト
- Harnessing Synthetic Data from Generative AI for Statistical Inference [6.0353292419288485]
本稿では, 統計学的観点から, 合成データ生成と利用の現況を概観する。
我々は,近代的な生成モデルの主要なクラス,それらのユースケース,およびそれらが提供するメリットについて調査する。
合成データを実観測用サロゲートとして処理した場合に発生する一般的な落とし穴について検討する。
論文 参考訳(メタデータ) (2026-03-05T17:24:41Z) - Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。
合成データがモデル一般化をどのように改善するかを批判的に検討する。
本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-09-07T19:28:52Z) - Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Artificial Data, Real Insights: Evaluating Opportunities and Risks of Expanding the Data Ecosystem with Synthetic Data [0.0]
Synthetic Dataは新しいものではないが、Generative AIの最近の進歩は、研究ツールボックスの拡張への関心を高めている。
この記事では、Synthetic Dataドメインの全範囲を分類します。
論文 参考訳(メタデータ) (2024-08-10T16:46:35Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - The Real Deal Behind the Artificial Appeal: Inferential Utility of Tabular Synthetic Data [40.165159490379146]
評価値が不偏であっても, 偽陽性の発見率(タイプ1の誤り)は不可避的に高いことが示唆された。
以前提案された補正係数が使用されているにもかかわらず、この問題は深層生成モデルに対して持続する。
論文 参考訳(メタデータ) (2023-12-13T02:04:41Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。