論文の概要: Mean-Squared Accuracy of Good-Turing Estimator
- arxiv url: http://arxiv.org/abs/2104.07029v1
- Date: Wed, 14 Apr 2021 17:23:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 15:07:00.504252
- Title: Mean-Squared Accuracy of Good-Turing Estimator
- Title(参考訳): グッドチューリング推定器の平均二乗精度
- Authors: Maciej Skorski
- Abstract要約: この作品は、任意のサンプルエンハンダアルファベットサイズのGood-Turing推定器の最大平均二乗誤差を特徴づける。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The brilliant method due to Good and Turing allows for estimating objects not
occurring in a sample. The problem, known under names "sample coverage" or
"missing mass" goes back to their cryptographic work during WWII, but over
years has found has many applications, including language modeling, inference
in ecology and estimation of distribution properties. This work characterizes
the maximal mean-squared error of the Good-Turing estimator, for any sample
\emph{and} alphabet size.
- Abstract(参考訳): Good and Turingによる素晴らしい方法では、サンプルに存在しないオブジェクトを推定することができる。
この問題は、"sample coverage" や "missing mass" という名前で知られ、第二次世界大戦の暗号作業に遡るが、長年にわたり、言語モデリング、生態学における推論、分布特性の推定など、多くの応用が認められてきた。
この研究は、任意のサンプル \emph{and} アルファベットサイズに対して、グッドチューリング推定器の最大平均二乗誤差を特徴づける。
関連論文リスト
- A sparse PAC-Bayesian approach for high-dimensional quantile prediction [0.0]
本稿では,高次元量子化予測のための確率論的機械学習手法を提案する。
擬似ベイズ的フレームワークとスケールした学生tとランゲヴィン・モンテカルロを併用して効率的な計算を行う。
その効果はシミュレーションや実世界のデータを通じて検証され、そこでは確立された頻繁な手法やベイズ的手法と競合する。
論文 参考訳(メタデータ) (2024-09-03T08:01:01Z) - On randomized estimators of the Hafnian of a nonnegative matrix [0.0]
ガウス・ボソンのサンプルは、古典的に難しいと信じられているサンプリングタスクを実行することで量子的優位性を示すことを目的としている。
非負行列に対しては、特定のランダム行列を生成し、その行列式を計算することに基づいて、ハフニアンのランダム化推定子の族が存在する。
ここでは、バルビノクとゴッドシル=ガットマン推定器と呼ばれる2つの推定器の性能について検討する。
論文 参考訳(メタデータ) (2023-12-15T19:00:07Z) - Closing the Curious Case of Neural Text Degeneration [91.22954750742183]
トラニケートサンプリングの有効性を理論的に説明する。
モデルエラーの既知の源であるソフトマックスボトルネックを利用して、特定のトークンが真の確率がゼロでないことを示す。
提案手法は,低エントロピーテキスト生成におけるしきい値ベースよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-02T23:16:25Z) - A Heavy-Tailed Algebra for Probabilistic Programming [53.32246823168763]
本稿では,確率変数の尾を解析するための体系的アプローチを提案する。
本稿では,確率型プログラミング言語コンパイラの静的解析(サンプル作成前)において,この手法をどのように利用できるかを示す。
実験結果から,重み付き代数を利用する推論アルゴリズムは,多数の密度モデリングおよび変分推論タスクにおいて優れた性能が得られることを確認した。
論文 参考訳(メタデータ) (2023-06-15T16:37:36Z) - Robust Gaussian Process Regression with Huber Likelihood [2.7184224088243365]
本稿では,ハマー確率分布として表される観測データの可能性を考慮した,ガウス過程フレームワークにおけるロバストなプロセスモデルを提案する。
提案モデルでは、予測統計に基づく重みを用いて、残差を拡大し、潜伏関数推定における垂直外れ値と悪レバレッジ点の影響を限定する。
論文 参考訳(メタデータ) (2023-01-19T02:59:33Z) - Score Matching for Truncated Density Estimation on a Manifold [6.53626518989653]
近年, トラッピング密度推定にスコアマッチングを用いる方法が提案されている。
我々は、境界を持つリーマン多様体に一致するトランカットされたスコアの新たな拡張を示す。
シミュレーションデータ実験において、スコアマッチング推定器は真のパラメータ値を低い推定誤差で近似することができる。
論文 参考訳(メタデータ) (2022-06-29T14:14:49Z) - Improving Maximum Likelihood Training for Text Generation with Density
Ratio Estimation [51.091890311312085]
本稿では,テキスト生成で遭遇する大規模なサンプル空間において,効率よく安定な自動回帰シーケンス生成モデルのトレーニング手法を提案する。
本手法は,品質と多様性の両面で,最大類似度推定や他の最先端シーケンス生成モデルよりも安定に優れている。
論文 参考訳(メタデータ) (2020-07-12T15:31:24Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z) - Robust and On-the-fly Dataset Denoising for Image Classification [72.10311040730815]
On-the-fly Data Denoising (ODD)は、間違ったラベルの例に対して堅牢だが、通常のトレーニングと比べて計算オーバーヘッドはほぼゼロである。
ODDはWebVisionやClothing1Mといった現実世界のデータセットを含む、幅広いデータセットで最先端の結果を達成することができる。
論文 参考訳(メタデータ) (2020-03-24T03:59:26Z) - Efficiently Sampling Functions from Gaussian Process Posteriors [76.94808614373609]
高速後部サンプリングのための簡易かつ汎用的なアプローチを提案する。
分離されたサンプルパスがガウス過程の後部を通常のコストのごく一部で正確に表現する方法を実証する。
論文 参考訳(メタデータ) (2020-02-21T14:03:16Z) - Parameter Space Factorization for Zero-Shot Learning across Tasks and
Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。
タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。
我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文 参考訳(メタデータ) (2020-01-30T16:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。