Fugu-MT 論文翻訳(概要): Conservative Likelihood Ratio Estimator for Infrequent Data Slightly above a Frequency Threshold

論文の概要: Conservative Likelihood Ratio Estimator for Infrequent Data Slightly above a Frequency Threshold

arxiv url: http://arxiv.org/abs/2211.00545v1
Date: Fri, 28 Oct 2022 10:02:20 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-02 13:26:06.624298
Title: Conservative Likelihood Ratio Estimator for Infrequent Data Slightly above a Frequency Threshold
Title（参考訳）: 周波数閾値を超える低頻度データに対する保守的類似度推定器
Authors: Masato Kikuchi, Yuhi Kusakabe, Tadachika Ozono
Abstract要約: ネーブ確率比推定は、頻度の低いデータに対してLRを過大評価することができる。この問題を回避する1つのアプローチは、周波数閾値を使用して、しきい値以下の周波数に対して推定値を0に設定することである。本研究は、低周波のしきい値よりわずかに高い保守的推定器を提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A naive likelihood ratio (LR) estimation using the observed frequencies of events can overestimate LRs for infrequent data. One approach to avoid this problem is to use a frequency threshold and set the estimates to zero for frequencies below the threshold. This approach eliminates the computation of some estimates, thereby making practical tasks using LRs more efficient. However, it still overestimates LRs for low frequencies near the threshold. This study proposes a conservative estimator for low frequencies, slightly above the threshold. Our experiment used LRs to predict the occurrence contexts of named entities from a corpus. The experimental results demonstrate that our estimator improves the prediction accuracy while maintaining efficiency in the context prediction task.
Abstract（参考訳）: 観測された事象の周波数を用いたナイーブ確率比(LR)推定は、頻度の低いデータに対してLRを過大評価することができる。この問題を回避する一つのアプローチは、周波数閾値を使い、しきい値以下の周波数の見積もりをゼロに設定することである。このアプローチはいくつかの推定値の計算を排除し、LRを用いた実用的なタスクをより効率的にする。しかし、しきい値付近の低周波数でLRを過大評価している。本研究は、低周波のしきい値よりわずかに高い保守的推定器を提案する。実験では、LRを用いて、コーパスから名前付きエンティティの発生状況を予測する。実験結果は,文脈予測タスクの効率を維持しつつ予測精度を向上させることを実証する。

関連論文リスト

Signal and Noise: A Framework for Reducing Uncertainty in Language Model Evaluation [103.66549325018741]
現在のベンチマークの違いを示す2つの重要な指標を紹介します。より優れた信号対雑音比を持つベンチマークは、小規模で意思決定を行う場合、より信頼性が高いことを示す。結論は、新しいベンチマークを作成する人や、どの既存のベンチマークを使うかを選択する人は、高い信号と低いノイズを目標にすることを推奨する。
論文参考訳（メタデータ） (2025-08-18T17:56:04Z)
Targeted tuning of random forests for quantile estimation and prediction intervals [0.0]
本稿では,推定定量値の精度を向上するランダム森林(RF)の新たなチューニング手法を提案する。そこで本研究では,QCLチューニング結果が,デフォルトパラメータ値を用いて達成した値よりも,より正確なカバレッジ確率を持つ定量推定値となることを示す。
論文参考訳（メタデータ） (2025-07-02T07:32:59Z)
Less Biased Noise Scale Estimation for Threshold-Robust RANSAC [0.9065034043031668]
ノイズスケール推定法であるSIMFITを再検討し,ノイズスケール推定のバイアスを求める。本稿では,SIMFIT++のマルチペア拡張を推定値のフィルタリングにより提案し,その結果を改善する。
論文参考訳（メタデータ） (2025-03-17T17:57:29Z)
Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文参考訳（メタデータ） (2024-06-05T13:36:38Z)
Improving Interpretability of Scores in Anomaly Detection Based on Gaussian-Bernoulli Restricted Boltzmann Machine [0.0]
GBRBMによる異常検出では、GBRBMのエネルギー関数と同一のスコアに基づいて正規値と異常値のデータを分類する。本稿では,その累積分布に基づいて,スコアの解釈可能性を向上させる尺度を提案する。また、解釈可能な尺度を用いてしきい値を設定するためのガイドラインを確立する。
論文参考訳（メタデータ） (2024-03-19T12:13:52Z)
Doubly-Robust Estimation for Unbiased Learning-to-Rank from Position-Biased Click Feedback [13.579420996461439]
IPS推定の代わりにランク毎の待遇を期待する新しいDR推定器を提案する。我々の結果は、最適な性能で収束するためには、桁違いに少ないデータポイントを必要とすることを示唆している。
論文参考訳（メタデータ） (2022-03-31T15:38:25Z)
Feature Selective Likelihood Ratio Estimator for Low- and Zero-frequency N-grams [0.4588028371034407]
自然言語処理(NLP)では、N-gramの確率比(LR)が周波数情報からしばしば推定される。コーパスは可能なN-グラムのごく一部しか含んでおらず、ほとんどはまれに発生する。低周波および0周波N-gramに対するLR推定器を提案する。
論文参考訳（メタデータ） (2021-11-05T09:38:43Z)
Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文参考訳（メタデータ） (2021-07-05T21:05:11Z)
Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文参考訳（メタデータ） (2021-07-05T12:44:39Z)
SLOE: A Faster Method for Statistical Inference in High-Dimensional Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文参考訳（メタデータ） (2021-03-23T17:48:56Z)
Bias-Corrected Peaks-Over-Threshold Estimation of the CVaR [2.552459629685159]
cvar(conditional value-at-risk)は、機械学習、金融、保険、エネルギーなどの分野で有用なリスク尺度である。極めて極端なリスクを測定する場合,試料平均値のCVaR推定法はうまく動作しない。この問題を緩和するために、CVaRはVaRよりも低い閾値で外挿することで推定することができる。
論文参考訳（メタデータ） (2021-03-08T20:29:06Z)
Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient Estimator [93.05919133288161]
一般的なGumbel-Softmax推定器のストレートスルー変量の分散は、ラオ・ブラックウェル化により減少できることを示す。これは平均二乗誤差を確実に減少させる。これは分散の低減、収束の高速化、および2つの教師なし潜在変数モデルの性能向上につながることを実証的に実証した。
論文参考訳（メタデータ） (2020-10-09T22:54:38Z)
SUMO: Unbiased Estimation of Log Marginal Probability for Latent Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文参考訳（メタデータ） (2020-04-01T11:49:30Z)
Improving predictions by nonlinear regression models from outlying input data [0.0]
機械学習/統計手法を環境科学に適用する場合、非線形回帰(NLR)モデルはリニア回帰(LR)よりもわずかに良く、時には悪いだけである。連続的非有界変数は環境科学において広く使われており、新しい入力データがトレーニング領域のはるかに外にあることは珍しくない。異常値については、信頼できないNLR予測をNLR$_mathrmor$またはLR予測に置き換えるか、あるいは"信頼できない予測"警告を発行することで置き換えることができる。
論文参考訳（メタデータ） (2020-03-17T20:28:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。