論文の概要: Uncertainty-Aware Data-Efficient AI: An Information-Theoretic Perspective
- arxiv url: http://arxiv.org/abs/2512.05267v1
- Date: Thu, 04 Dec 2025 21:44:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:56.81991
- Title: Uncertainty-Aware Data-Efficient AI: An Information-Theoretic Perspective
- Title(参考訳): 不確実性を考慮したデータ効率AI - 情報理論の視点から
- Authors: Osvaldo Simeone, Yaniv Romano,
- Abstract要約: ロボット工学、電気通信、医療といったコンテキスト固有のアプリケーションでは、人工知能システムは訓練データに制限があるという課題に直面していることが多い。
本稿では,2つの相補的手法を用いて,データ制限体制に対処する形式的手法について検討する。
- 参考スコア(独自算出の注目度): 48.073471560778984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In context-specific applications such as robotics, telecommunications, and healthcare, artificial intelligence systems often face the challenge of limited training data. This scarcity introduces epistemic uncertainty, i.e., reducible uncertainty stemming from incomplete knowledge of the underlying data distribution, which fundamentally limits predictive performance. This review paper examines formal methodologies that address data-limited regimes through two complementary approaches: quantifying epistemic uncertainty and mitigating data scarcity via synthetic data augmentation. We begin by reviewing generalized Bayesian learning frameworks that characterize epistemic uncertainty through generalized posteriors in the model parameter space, as well as ``post-Bayes'' learning frameworks. We continue by presenting information-theoretic generalization bounds that formalize the relationship between training data quantity and predictive uncertainty, providing a theoretical justification for generalized Bayesian learning. Moving beyond methods with asymptotic statistical validity, we survey uncertainty quantification methods that provide finite-sample statistical guarantees, including conformal prediction and conformal risk control. Finally, we examine recent advances in data efficiency by combining limited labeled data with abundant model predictions or synthetic data. Throughout, we take an information-theoretic perspective, highlighting the role of information measures in quantifying the impact of data scarcity.
- Abstract(参考訳): ロボット工学、電気通信、医療といったコンテキスト固有のアプリケーションでは、人工知能システムは訓練データに制限があるという課題に直面していることが多い。
この不足は疫学的な不確実性、すなわち、根底にあるデータ分布の不完全な知識から生じる再現可能な不確実性を導入し、予測性能を根本的に制限する。
本稿では,2つの相補的アプローチにより,データ制限体制に対処する形式的手法について検討する。
まず、モデルパラメータ空間の一般化後部を特徴付ける一般的なベイズ学習フレームワークと、 `post-Bayes'学習フレームワークのレビューから始める。
我々は、トレーニングデータ量と予測不確実性の関係を定式化する情報理論の一般化境界を提示し、一般化ベイズ学習の理論的正当性を提供する。
漸近的な統計的妥当性を持つ手法を超えて、共形予測や共形リスク制御を含む有限サンプル統計保証を提供する不確実性定量化手法を調査した。
最後に,限られたラベル付きデータと豊富なモデル予測や合成データを組み合わせることで,データ効率の最近の進歩を考察する。
情報理論の観点からは,データ不足の影響の定量化における情報尺度の役割を強調した。
関連論文リスト
- RAPID: Risk of Attribute Prediction-Induced Disclosure in Synthetic Microdata [0.0]
本稿では,現実的な攻撃モデル下での推論的脆弱性を直接定量化する情報開示リスク尺度を提案する。
敵は、解放された合成データのみに基づいて予測モデルを訓練し、実際の個人の擬似識別器に適用する。
本報告では,攻撃者が真のクラスに対してどの程度の自信を持っているかを評価するためのベースライン正規化信頼度スコアを提案する。
論文 参考訳(メタデータ) (2026-02-09T22:03:11Z) - Do We Really Even Need Data? A Modern Look at Drawing Inference with Predicted Data [0.8415089854734883]
高い予測精度は、下流の正しい推測を保証しないことを示す。
予測が変数間の推定あるいは歪関係を体系的にシフトした場合,および (ii) 差は, 予測モデルからの不確実性や真のデータの固有変数を無視する場合に, バイアスという統計的概念に還元されることを示す。
論文 参考訳(メタデータ) (2025-12-05T06:24:23Z) - Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Statistical Guarantees in Synthetic Data through Conformal Adversarial Generation [1.3654846342364308]
既存の生成モデルは魅力的な合成サンプルを生成するが、基礎となるデータ分布との関係に関する厳密な統計的保証は欠如している。
本稿では,共形予測手法をGAN(Generative Adrial Networks)に組み込んだ新しいフレームワークを提案する。
このアプローチは、CGAN(Conformalized GAN)と呼ばれ、従来のGANの生成能力を維持しながら、キャリブレーション特性の強化を示す。
論文 参考訳(メタデータ) (2025-04-23T19:07:44Z) - MIBP-Cert: Certified Training against Data Perturbations with Mixed-Integer Bilinear Programs [50.41998220099097]
トレーニング中のデータエラー、汚職、中毒攻撃は、現代のAIシステムの信頼性に大きな脅威をもたらす。
混合整数双線形プログラミング(MIBP)に基づく新しい認証手法MIBP-Certを紹介する。
摂動データや操作データを通じて到達可能なパラメータの集合を計算することで、可能なすべての結果を予測することができ、堅牢性を保証することができる。
論文 参考訳(メタデータ) (2024-12-13T14:56:39Z) - Uncertainty for Active Learning on Graphs [70.44714133412592]
不確実性サンプリングは、機械学習モデルのデータ効率を改善することを目的とした、アクティブな学習戦略である。
予測の不確実性を超えた不確実性サンプリングをベンチマークし、他のアクティブラーニング戦略に対する大きなパフォーマンスギャップを強調します。
提案手法は,データ生成プロセスの観点から基幹的ベイズ不確実性推定法を開発し,不確実性サンプリングを最適クエリへ導く上での有効性を実証する。
論文 参考訳(メタデータ) (2024-05-02T16:50:47Z) - Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification [3.175239447683357]
本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。
我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
論文 参考訳(メタデータ) (2023-05-30T01:01:36Z) - Non-Linear Spectral Dimensionality Reduction Under Uncertainty [107.01839211235583]
我々は、不確実性情報を活用し、いくつかの従来のアプローチを直接拡張する、NGEUと呼ばれる新しい次元削減フレームワークを提案する。
提案したNGEUの定式化は,大域的な閉形式解を示し,Radecherの複雑性に基づいて,基礎となる不確実性がフレームワークの一般化能力に理論的にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2022-02-09T19:01:33Z) - DEUP: Direct Epistemic Uncertainty Prediction [56.087230230128185]
認識の不確実性は、学習者の知識の欠如によるサンプル外の予測エラーの一部である。
一般化誤差の予測を学習し, aleatoric uncertaintyの推定を減算することで, 認識的不確かさを直接推定する原理的アプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T23:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。