Fugu-MT 論文翻訳(概要): Generative Augmented Inference

論文の概要: Generative Augmented Inference

arxiv url: http://arxiv.org/abs/2604.14575v1
Date: Thu, 16 Apr 2026 03:10:37 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-17 21:29:31.702347
Title: Generative Augmented Inference
Title（参考訳）: Generative Augmented Inference
Authors: Cheng Lu, Mengxin Wang, Dennis J. Zhang, Heng Zhang,
Abstract要約: 本稿では、AI生成した出力を人間のラベル付き結果のモデル推定のための情報機能として組み込んだ生成拡張推論(GAI)を提案する。すべてのメソッドが同じ補助的な入力にアクセスする小売価格では、GAIはオルタナティブな推定器を一貫して上回っている。健康保険の選択においては、決定精度を維持しながら、ラベル付け要件を90%以上削減する。
参考スコア（独自算出の注目度）: 8.696405690082058
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Data-driven operations management often relies on parameters estimated from costly human-generated labels. Recent advances in large language models (LLMs) and other AI systems offer inexpensive auxiliary data, but introduce a new challenge: AI outputs are not direct observations of the target outcomes, but could involve high-dimensional representations with complex and unknown relationships to human labels. Conventional methods leverage AI predictions as direct proxies for true labels, which can be inefficient or unreliable when this relationship is weak or misspecified. We propose Generative Augmented Inference (GAI), a general framework that incorporates AI-generated outputs as informative features for estimating models of human-labeled outcomes. GAI uses an orthogonal moment construction that enables consistent estimation and valid inference with flexible, nonparametric relationship between LLM-generated outputs and human labels. We establish asymptotic normality and show a "safe default" property: relative to human-data-only estimators, GAI weakly improves estimation efficiency under arbitrary auxiliary signals and yields strict gains whenever the auxiliary information is predictive. Empirically, GAI outperforms benchmarks across diverse settings. In conjoint analysis with weak auxiliary signals, GAI reduces estimation error by about 50% and lowers human labeling requirements by over 75%. In retail pricing, where all methods access the same auxiliary inputs, GAI consistently outperforms alternative estimators, highlighting the value of its construction rather than differences in information. In health insurance choice, it cuts labeling requirements by over 90% while maintaining decision accuracy. Across applications, GAI improves confidence interval coverage without inflating width. Overall, GAI provides a principled and scalable approach to integrating AI-generated information.
Abstract（参考訳）: データ駆動型の運用管理は、コストのかかる人為的なラベルから推定されるパラメータに依存することが多い。大規模言語モデル(LLM)やその他のAIシステムの最近の進歩は、安価な補助データを提供するが、新しい課題を提起する。AI出力は、対象とする結果を直接観察するものではなく、複雑な、未知の関係を持つ高次元表現を含む可能性がある。従来の手法では、AI予測を真のラベルの直接的なプロキシとして利用しており、この関係が弱かったり不特定であったりすると、効率が悪く、信頼できない。本稿では,AI生成出力を情報機能として組み込んだ汎用フレームワークである生成拡張推論(GAI)を提案する。 GAIは直交モーメント構造を用いて、LCM生成した出力と人間のラベルの間のフレキシブルで非パラメトリックな関係による一貫した推定と有効な推論を可能にする。我々は漸近的正規性を確立し、「安全なデフォルト」特性を示す:人間データのみの推定値と比較して、AIは任意の補助信号による推定効率を弱く改善し、補助情報が予測されるたびに厳密な利得を得る。経験的に、GAIはさまざまな設定でベンチマークを上回ります。弱い補助信号との結合解析において、GAIは推定誤差を約50%削減し、人間のラベル付け要求を75%以上低減する。すべてのメソッドが同じ補助入力にアクセスする小売価格では、GAIは情報の違いよりも構築の価値を強調して、オルタナティブな推定値を上回っている。健康保険の選択においては、決定精度を維持しながら、ラベル付け要件を90%以上削減する。アプリケーション全体にわたって、GAIは幅を膨らませることなく信頼区間カバレッジを改善する。 GAIは、AI生成情報を統合するための原則付きかつスケーラブルなアプローチを提供する。

関連論文リスト

Label Curation Using Agentic AI [3.500372926575144]
本稿では,大規模マルチモーダルデータアノテーションのためのエージェントAIフレームワークであるAURAを紹介する。 AURAは、複数のAIエージェントをコーディネートして、基礎的な真実を必要とせずにラベルを生成し、検証する。 AURAは最大5.8%の精度向上を実現している。品質アノテータの貧弱さによるより困難な設定では、改善はベースラインよりも最大50%向上する。
論文参考訳（メタデータ） (2026-01-30T18:58:52Z)
Semi-Supervised Regression with Heteroscedastic Pseudo-Labels [50.54050677867914]
両レベル最適化の観点から,疑似ラベルの影響を動的に調整する不確実性認識型擬似ラベル化フレームワークを提案する。我々は、様々なベンチマークSSRデータセットにまたがって、我々のアプローチを検証するための理論的洞察と広範な実験を提供する。
論文参考訳（メタデータ） (2025-10-17T03:06:23Z)
Semi-supervised Node Importance Estimation with Informative Distribution Modeling for Uncertainty Regularization [13.745026710984469]
異種グラフにおける未ラベルデータの学習品質向上を目的とした,最初の半教師付きノード重要度推定フレームワークであるEASINGを提案する。従来のアプローチとは異なり、EASingはモデル予測の信頼性を反映する不確実性を明示的に捉えている。 EASINGはラベル付きおよび擬似ラベル付きデータに基づいて、ノードの不確かさの正則化を伴う効果的な半教師付きヘテロ代数学学習を開発する。
論文参考訳（メタデータ） (2025-03-26T16:27:06Z)
Detecting Dataset Bias in Medical AI: A Generalized and Modality-Agnostic Auditing Framework [8.017827642932746]
データセットに対する一般属性ユーティリティと検出可能性によるバイアステスト(G-AUDIT)は、モダリティに依存しないデータセット監査フレームワークである。本手法は,患者属性を含むデータ特性とタスクレベルのアノテーションの関係について検討する。 G-AUDITは、従来の定性的手法で見過ごされる微妙な偏見をうまく識別する。
論文参考訳（メタデータ） (2025-03-13T02:16:48Z)
Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文参考訳（メタデータ） (2024-06-06T17:37:39Z)
AAA: an Adaptive Mechanism for Locally Differential Private Mean Estimation [42.95927712062214]
ローカルディファレンシャルプライバシ(LDP)は、一般的なソフトウェアシステムで採用されている強力なプライバシ標準である。本稿では, 平均効用に対処する分布認識手法である, 適応型アダプティブ (AAA) 機構を提案する。我々は、厳密なプライバシー証明、ユーティリティ分析、そしてAAAと最先端のメカニズムを比較した広範な実験を提供する。
論文参考訳（メタデータ） (2024-04-02T04:22:07Z)
Augmentation-Aware Self-Supervision for Data-Efficient GAN Training [68.81471633374393]
識別器が過度に適合する傾向があるため、限られたデータでGANを訓練することは困難である。本稿では,拡張データの拡張パラメータを予測する,拡張型自己教師型識別器を提案する。本稿では,クラス条件の BigGAN と非条件の StyleGAN2 アーキテクチャを用いた State-of-the-art (SOTA) 手法と比較する。
論文参考訳（メタデータ） (2022-05-31T10:35:55Z)
Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文参考訳（メタデータ） (2022-01-11T23:01:12Z)
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。 EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文参考訳（メタデータ） (2021-04-07T06:02:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。