論文の概要: Conservative Likelihood Ratio Estimator for Infrequent Data Slightly
above a Frequency Threshold
- arxiv url: http://arxiv.org/abs/2211.00545v1
- Date: Fri, 28 Oct 2022 10:02:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:26:06.624298
- Title: Conservative Likelihood Ratio Estimator for Infrequent Data Slightly
above a Frequency Threshold
- Title(参考訳): 周波数閾値を超える低頻度データに対する保守的類似度推定器
- Authors: Masato Kikuchi, Yuhi Kusakabe, Tadachika Ozono
- Abstract要約: ネーブ確率比推定は、頻度の低いデータに対してLRを過大評価することができる。
この問題を回避する1つのアプローチは、周波数閾値を使用して、しきい値以下の周波数に対して推定値を0に設定することである。
本研究は、低周波のしきい値よりわずかに高い保守的推定器を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A naive likelihood ratio (LR) estimation using the observed frequencies of
events can overestimate LRs for infrequent data. One approach to avoid this
problem is to use a frequency threshold and set the estimates to zero for
frequencies below the threshold. This approach eliminates the computation of
some estimates, thereby making practical tasks using LRs more efficient.
However, it still overestimates LRs for low frequencies near the threshold.
This study proposes a conservative estimator for low frequencies, slightly
above the threshold. Our experiment used LRs to predict the occurrence contexts
of named entities from a corpus. The experimental results demonstrate that our
estimator improves the prediction accuracy while maintaining efficiency in the
context prediction task.
- Abstract(参考訳): 観測された事象の周波数を用いたナイーブ確率比(LR)推定は、頻度の低いデータに対してLRを過大評価することができる。
この問題を回避する一つのアプローチは、周波数閾値を使い、しきい値以下の周波数の見積もりをゼロに設定することである。
このアプローチはいくつかの推定値の計算を排除し、LRを用いた実用的なタスクをより効率的にする。
しかし、しきい値付近の低周波数でLRを過大評価している。
本研究は、低周波のしきい値よりわずかに高い保守的推定器を提案する。
実験では、LRを用いて、コーパスから名前付きエンティティの発生状況を予測する。
実験結果は,文脈予測タスクの効率を維持しつつ予測精度を向上させることを実証する。
関連論文リスト
- Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Improving Multi-class Classifier Using Likelihood Ratio Estimation with
Regularization [0.0]
確率比 (LRs) を用いて定義された広義ベイズ分類器 (UNB)cite Komiya:13 は不均衡な分類問題に対処するために提案された。
UNBで使用されるLR推定器は、低周波データに対してLRを過大評価し、分類性能を低下させる。
不均衡データを用いた実験により,正規化パラメータを用いてクラスバランスに応じて分類スコアを効果的に調整できることが判明した。
論文 参考訳(メタデータ) (2022-10-28T10:07:53Z) - Doubly-Robust Estimation for Unbiased Learning-to-Rank from
Position-Biased Click Feedback [13.579420996461439]
IPS推定の代わりにランク毎の待遇を期待する新しいDR推定器を提案する。
我々の結果は、最適な性能で収束するためには、桁違いに少ないデータポイントを必要とすることを示唆している。
論文 参考訳(メタデータ) (2022-03-31T15:38:25Z) - Feature Selective Likelihood Ratio Estimator for Low- and Zero-frequency
N-grams [0.4588028371034407]
自然言語処理(NLP)では、N-gramの確率比(LR)が周波数情報からしばしば推定される。
コーパスは可能なN-グラムのごく一部しか含んでおらず、ほとんどはまれに発生する。
低周波および0周波N-gramに対するLR推定器を提案する。
論文 参考訳(メタデータ) (2021-11-05T09:38:43Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Bias-Corrected Peaks-Over-Threshold Estimation of the CVaR [2.552459629685159]
cvar(conditional value-at-risk)は、機械学習、金融、保険、エネルギーなどの分野で有用なリスク尺度である。
極めて極端なリスクを測定する場合,試料平均値のCVaR推定法はうまく動作しない。
この問題を緩和するために、CVaRはVaRよりも低い閾値で外挿することで推定することができる。
論文 参考訳(メタデータ) (2021-03-08T20:29:06Z) - Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient
Estimator [93.05919133288161]
一般的なGumbel-Softmax推定器のストレートスルー変量の分散は、ラオ・ブラックウェル化により減少できることを示す。
これは平均二乗誤差を確実に減少させる。
これは分散の低減、収束の高速化、および2つの教師なし潜在変数モデルの性能向上につながることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-09T22:54:38Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z) - Improving predictions by nonlinear regression models from outlying input
data [0.0]
機械学習/統計手法を環境科学に適用する場合、非線形回帰(NLR)モデルはリニア回帰(LR)よりもわずかに良く、時には悪いだけである。
連続的非有界変数は環境科学において広く使われており、新しい入力データがトレーニング領域のはるかに外にあることは珍しくない。
異常値については、信頼できないNLR予測をNLR$_mathrmor$またはLR予測に置き換えるか、あるいは"信頼できない予測"警告を発行することで置き換えることができる。
論文 参考訳(メタデータ) (2020-03-17T20:28:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。