論文の概要: Conservative Likelihood Ratio Estimator for Infrequent Data Slightly
above a Frequency Threshold
- arxiv url: http://arxiv.org/abs/2211.00545v1
- Date: Fri, 28 Oct 2022 10:02:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:26:06.624298
- Title: Conservative Likelihood Ratio Estimator for Infrequent Data Slightly
above a Frequency Threshold
- Title(参考訳): 周波数閾値を超える低頻度データに対する保守的類似度推定器
- Authors: Masato Kikuchi, Yuhi Kusakabe, Tadachika Ozono
- Abstract要約: ネーブ確率比推定は、頻度の低いデータに対してLRを過大評価することができる。
この問題を回避する1つのアプローチは、周波数閾値を使用して、しきい値以下の周波数に対して推定値を0に設定することである。
本研究は、低周波のしきい値よりわずかに高い保守的推定器を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A naive likelihood ratio (LR) estimation using the observed frequencies of
events can overestimate LRs for infrequent data. One approach to avoid this
problem is to use a frequency threshold and set the estimates to zero for
frequencies below the threshold. This approach eliminates the computation of
some estimates, thereby making practical tasks using LRs more efficient.
However, it still overestimates LRs for low frequencies near the threshold.
This study proposes a conservative estimator for low frequencies, slightly
above the threshold. Our experiment used LRs to predict the occurrence contexts
of named entities from a corpus. The experimental results demonstrate that our
estimator improves the prediction accuracy while maintaining efficiency in the
context prediction task.
- Abstract(参考訳): 観測された事象の周波数を用いたナイーブ確率比(LR)推定は、頻度の低いデータに対してLRを過大評価することができる。
この問題を回避する一つのアプローチは、周波数閾値を使い、しきい値以下の周波数の見積もりをゼロに設定することである。
このアプローチはいくつかの推定値の計算を排除し、LRを用いた実用的なタスクをより効率的にする。
しかし、しきい値付近の低周波数でLRを過大評価している。
本研究は、低周波のしきい値よりわずかに高い保守的推定器を提案する。
実験では、LRを用いて、コーパスから名前付きエンティティの発生状況を予測する。
実験結果は,文脈予測タスクの効率を維持しつつ予測精度を向上させることを実証する。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Improving Interpretability of Scores in Anomaly Detection Based on Gaussian-Bernoulli Restricted Boltzmann Machine [0.0]
GBRBMによる異常検出では、GBRBMのエネルギー関数と同一のスコアに基づいて正規値と異常値のデータを分類する。
本稿では,その累積分布に基づいて,スコアの解釈可能性を向上させる尺度を提案する。
また、解釈可能な尺度を用いてしきい値を設定するためのガイドラインを確立する。
論文 参考訳(メタデータ) (2024-03-19T12:13:52Z) - Doubly-Robust Estimation for Unbiased Learning-to-Rank from
Position-Biased Click Feedback [13.579420996461439]
IPS推定の代わりにランク毎の待遇を期待する新しいDR推定器を提案する。
我々の結果は、最適な性能で収束するためには、桁違いに少ないデータポイントを必要とすることを示唆している。
論文 参考訳(メタデータ) (2022-03-31T15:38:25Z) - Feature Selective Likelihood Ratio Estimator for Low- and Zero-frequency
N-grams [0.4588028371034407]
自然言語処理(NLP)では、N-gramの確率比(LR)が周波数情報からしばしば推定される。
コーパスは可能なN-グラムのごく一部しか含んでおらず、ほとんどはまれに発生する。
低周波および0周波N-gramに対するLR推定器を提案する。
論文 参考訳(メタデータ) (2021-11-05T09:38:43Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Bias-Corrected Peaks-Over-Threshold Estimation of the CVaR [2.552459629685159]
cvar(conditional value-at-risk)は、機械学習、金融、保険、エネルギーなどの分野で有用なリスク尺度である。
極めて極端なリスクを測定する場合,試料平均値のCVaR推定法はうまく動作しない。
この問題を緩和するために、CVaRはVaRよりも低い閾値で外挿することで推定することができる。
論文 参考訳(メタデータ) (2021-03-08T20:29:06Z) - Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient
Estimator [93.05919133288161]
一般的なGumbel-Softmax推定器のストレートスルー変量の分散は、ラオ・ブラックウェル化により減少できることを示す。
これは平均二乗誤差を確実に減少させる。
これは分散の低減、収束の高速化、および2つの教師なし潜在変数モデルの性能向上につながることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-09T22:54:38Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z) - Improving predictions by nonlinear regression models from outlying input
data [0.0]
機械学習/統計手法を環境科学に適用する場合、非線形回帰(NLR)モデルはリニア回帰(LR)よりもわずかに良く、時には悪いだけである。
連続的非有界変数は環境科学において広く使われており、新しい入力データがトレーニング領域のはるかに外にあることは珍しくない。
異常値については、信頼できないNLR予測をNLR$_mathrmor$またはLR予測に置き換えるか、あるいは"信頼できない予測"警告を発行することで置き換えることができる。
論文 参考訳(メタデータ) (2020-03-17T20:28:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。