論文の概要: Confidence Intervals for Unobserved Events
- arxiv url: http://arxiv.org/abs/2211.03052v1
- Date: Sun, 6 Nov 2022 07:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 19:16:55.313584
- Title: Confidence Intervals for Unobserved Events
- Title(参考訳): 未観測イベントの信頼区間
- Authors: Amichai Painsky
- Abstract要約: 可算アルファベット上の未知の分布から有限標本を考える。
観測されていないイベントは、サンプルに現れないアルファベット記号である。
観測不能事象に対する新しい間隔推定手法を提案する。
- 参考スコア(独自算出の注目度): 6.878547831852427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider a finite sample from an unknown distribution over a countable
alphabet. Unobserved events are alphabet symbols which do not appear in the
sample. Estimating the probabilities of unobserved events is a basic problem in
statistics and related fields, which was extensively studied in the context of
point estimation. In this work we introduce a novel interval estimation scheme
for unobserved events. Our proposed framework applies selective inference, as
we construct confidence intervals (CIs) for the desired set of parameters.
Interestingly, we show that obtained CIs are dimension-free, as they do not
grow with the alphabet size. Further, we show that these CIs are (almost)
tight, in the sense that they cannot be further improved without violating the
prescribed coverage rate. We demonstrate the performance of our proposed scheme
in synthetic and real-world experiments, showing a significant improvement over
the alternatives. Finally, we apply our proposed scheme to large alphabet
modeling. We introduce a novel simultaneous CI scheme for large alphabet
distributions which outperforms currently known methods while maintaining the
prescribed coverage rate.
- Abstract(参考訳): 可算アルファベット上の未知分布からの有限サンプルを考える。
観測されていないイベントは、サンプルに現れないアルファベット記号である。
観測されていない事象の確率を推定することは統計学および関連する分野における基本的な問題であり、点推定の文脈で広く研究された。
本研究では,観測不能事象に対する新しい間隔推定手法を提案する。
提案手法は,所望のパラメータ集合に対する信頼区間(CI)を構成するため,選択的推論を適用する。
興味深いことに、得られたCIはアルファベットサイズで成長しないため、次元自由である。
さらに,これらのCIは(ほぼ)厳密なものであり,所定のカバレッジ率に違反することなく,さらなる改善が不可能であることを示す。
提案手法の性能を実世界の合成実験で実証し, 代替案よりも大幅に向上したことを示す。
最後に,提案手法を大規模アルファベットモデルに適用する。
本稿では,現在知られている方法よりも高い精度で,所定のカバレッジ率を維持しつつ,大きなアルファベット分布の同時CI方式を提案する。
関連論文リスト
- Post-hoc Probabilistic Vision-Language Models [51.12284891724463]
視覚言語モデル(VLM)は、分類、検索、生成タスクにおいて顕著な成功を収めている。
追加トレーニングを必要としないVLMにおけるポストホック不確実性評価を提案する。
この結果から,大規模モデルの安全性クリティカルな応用が期待できることがわかった。
論文 参考訳(メタデータ) (2024-12-08T18:16:13Z) - Distribution-Free Conformal Joint Prediction Regions for Neural Marked Temporal Point Processes [4.324839843326325]
我々は、共形予測の枠組みを用いて、ニューラルTPPモデルにおける不確実性に対するより信頼性の高い手法を開発した。
主な目的は、イベントの到着時刻とマークに対する分布自由な共同予測領域を生成し、有限サンプルの限界カバレッジを保証することである。
論文 参考訳(メタデータ) (2024-01-09T15:28:29Z) - Score Matching-based Pseudolikelihood Estimation of Neural Marked
Spatio-Temporal Point Process with Uncertainty Quantification [59.81904428056924]
我々は、不確実な定量化を伴うmarkPsを学習するためのスコアMAtching推定器であるSMASHを紹介する。
具体的には,スコアマッチングによるマークPsの擬似的類似度を推定することにより,正規化自由度を推定する。
提案手法の優れた性能は、事象予測と不確実性定量化の両方において広範な実験によって実証される。
論文 参考訳(メタデータ) (2023-10-25T02:37:51Z) - User-defined Event Sampling and Uncertainty Quantification in Diffusion
Models for Physical Dynamical Systems [49.75149094527068]
拡散モデルを用いて予測を行い,カオス力学系に対する不確かさの定量化が可能であることを示す。
本研究では,雑音レベルが低下するにつれて真の分布に収束する条件付きスコア関数の確率的近似法を開発する。
推論時に非線形ユーザ定義イベントを条件付きでサンプリングすることができ、分布の尾部からサンプリングした場合でもデータ統計と一致させることができる。
論文 参考訳(メタデータ) (2023-06-13T03:42:03Z) - Adaptive Conformal Prediction by Reweighting Nonconformity Score [0.0]
我々は、QRF(Quantile Regression Forest)を用いて、不整合スコアの分布を学習し、QRFの重みを利用して、テストポイントに類似した残差を持つサンプルにより重要度を割り当てる。
提案手法は,仮定のない有限標本境界範囲と訓練条件範囲を満足し,適切な仮定の下で条件付き範囲を確保できる。
論文 参考訳(メタデータ) (2023-03-22T16:42:19Z) - What is Flagged in Uncertainty Quantification? Latent Density Models for
Uncertainty Categorization [68.15353480798244]
不確実性定量化(UQ)は、信頼できる機械学習モデルを作成する上で不可欠である。
近年、疑わしい事例にフラグを立てるUQ手法が急上昇している。
分類タスクにおけるUQ手法によってフラグ付けされた不確実な例を分類する枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-11T19:47:00Z) - Prediction Sets Adaptive to Unknown Covariate Shift [18.105704797438417]
有限サンプル被覆保証付き予測集合は非形式的であることを示す。
そこで我々は,予測セットを効率的に構築する,新しいフレキシブルな分散フリー手法PredSet-1Stepを提案する。
論文 参考訳(メタデータ) (2022-03-11T17:53:14Z) - Comparing Sequential Forecasters [35.38264087676121]
2つの予測器を考えてみましょう。それぞれが時間とともに一連のイベントを予測します。
オンラインでもポストホックでも、予測と結果がどのように生成されたかの検証不可能な仮定を避けながら、これらの予測をどのように比較すればよいのか?
予測スコアの時間差を推定するための新しい逐次推論手法を提案する。
実世界の野球と天気予報機を比較することで,我々のアプローチを実証的に検証する。
論文 参考訳(メタデータ) (2021-09-30T22:54:46Z) - Complex Event Forecasting with Prediction Suffix Trees: Extended
Technical Report [70.7321040534471]
複合イベント認識(CER)システムは、イベントのリアルタイムストリーム上のパターンを"即時"検出する能力によって、過去20年間に人気が高まっている。
このような現象が実際にCERエンジンによって検出される前に、パターンがいつ発生するかを予測する方法が不足している。
複雑なイベント予測の問題に対処しようとする形式的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-01T09:52:31Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。