論文の概要: A Two Parameters Equation for Word Rank-Frequency Relation
- arxiv url: http://arxiv.org/abs/2205.00638v1
- Date: Mon, 2 May 2022 04:07:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 14:25:46.932045
- Title: A Two Parameters Equation for Word Rank-Frequency Relation
- Title(参考訳): 単語ランク-周波数関係の2つのパラメータ式
- Authors: Chenchen Ding
- Abstract要約: f (r;s,t) = left(fracr_tt maxrright)1-s left(fracr_tt max+t cdot r_tt expr+t cdot r_tt expright)1+(1+t)s ] ここで $r_tt max$ と $r_tt exp$ は最大値と期待値である。
- 参考スコア(独自算出の注目度): 6.868394993724233
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Let $f (\cdot)$ be the absolute frequency of words and $r$ be the rank of
words in decreasing order of frequency, then the following function can fit the
rank-frequency relation \[ f (r;s,t) = \left(\frac{r_{\tt max}}{r}\right)^{1-s}
\left(\frac{r_{\tt max}+t \cdot r_{\tt exp}}{r+t \cdot r_{\tt
exp}}\right)^{1+(1+t)s} \] where $r_{\tt max}$ and $r_{\tt exp}$ are the
maximum and the expectation of the rank, respectively; $s>0$ and $t>0$ are
parameters estimated from data. On well-behaved data, there should be $s<1$ and
$s \cdot t < 1$.
- Abstract(参考訳): f (\cdot)$ を単語の絶対周波数とし、$r$ を頻度の順に単語のランクとすると、次の関数はランク周波数関係 \[ f (r;s,t) = \left(\frac{r_{\tt max}}{r}\right)^{1-s} \left(\frac{r_{\tt max}+t \cdot r_{\ttt exp}}{r+t \cdot r_{\tt exp}}\right)^{1+(1+t)s} \] ここで $r_{\t max}$ と $r_{\ttt exp}$ はそれぞれランクの最大値であり、$s>0$ と $t>0$ はデータから推定されるパラメータである。
well-behavedデータには$s<1$と$s \cdot t < 1$があるべきです。
関連論文リスト
- Low-rank Matrix Bandits with Heavy-tailed Rewards [55.03293214439741]
アンダーライン重み付きアンダーラインリワード(LowHTR)を用いたアンダーラインローランク行列バンディットの問題点について検討する。
観測されたペイオフに対するトランケーションと動的探索を利用して,LOTUSと呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-26T21:54:31Z) - On the $O(\frac{\sqrt{d}}{T^{1/4}})$ Convergence Rate of RMSProp and Its Momentum Extension Measured by $\ell_1$ Norm [59.65871549878937]
本稿では、RMSPropとその運動量拡張を考察し、$frac1Tsum_k=1Tの収束速度を確立する。
我々の収束率は、次元$d$を除くすべての係数に関して下界と一致する。
収束率は$frac1Tsum_k=1Tと類似していると考えられる。
論文 参考訳(メタデータ) (2024-02-01T07:21:32Z) - $\ell_p$-Regression in the Arbitrary Partition Model of Communication [59.89387020011663]
コーディネータモデルにおける分散$ell_p$-regression問題のランダム化通信複雑性について考察する。
p = 2$、すなわち最小二乗回帰の場合、$tildeTheta(sd2 + sd/epsilon)$ bitsの最初の最適境界を与える。
p in (1,2)$ に対して、$tildeO(sd2/epsilon + sd/mathrmpoly(epsilon)$ upper bound を得る。
論文 参考訳(メタデータ) (2023-07-11T08:51:53Z) - Low-Rank Approximation with $1/\epsilon^{1/3}$ Matrix-Vector Products [58.05771390012827]
我々は、任意のSchatten-$p$ノルムの下で、低ランク近似のためのクリロフ部分空間に基づく反復法について研究する。
我々の主な成果は、$tildeO(k/sqrtepsilon)$ matrix-vector productのみを使用するアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-10T16:10:41Z) - Differentially Private $\ell_1$-norm Linear Regression with Heavy-tailed
Data [22.233705161499273]
我々は$epsilon$-DPモデルにおける$ell_1$-norm線形回帰に注目した。
我々は高い確率で$tildeO(sqrtfracdnepsilon)$の上限を達成することができることを示す。
我々のアルゴリズムは、データの各座標が有界なモーメントを持つような、よりリラックスしたケースにも拡張できる。
論文 参考訳(メタデータ) (2022-01-10T08:17:05Z) - Single Pass Entrywise-Transformed Low Rank Approximation [44.14819869788393]
Liang et al.は、$n times n$ matrix $A$ for a $n cdot operatornamepoly(epsilon-1klog n)$ words of memory, with overall error 10|f(A)-[f(A)]_k|_1,22$, where $[f(A)]_k$ is the best rank-$k$ approximation to $f(A)$ and $
論文 参考訳(メタデータ) (2021-07-16T13:22:29Z) - Nearly Horizon-Free Offline Reinforcement Learning [97.36751930393245]
S$状態、$A$アクション、計画的地平$H$で、エピソードな時間同質なMarkov決定プロセスに関するオフライン強化学習を再考する。
経験的MDPを用いた評価と計画のための,約$H$自由なサンプル複雑性境界の最初の集合を得る。
論文 参考訳(メタデータ) (2021-03-25T18:52:17Z) - Optimal $\ell_1$ Column Subset Selection and a Fast PTAS for Low Rank
Approximation [0.0]
カラムサブセット選択をベースとした$ell_p$ローランク近似アルゴリズムで$tildeO(k)$カラムをサンプリングする。
我々は、カラム部分集合選択に基づく$ell_p$低階近似を1p2$で厳密な上限と下限を得るように、結果を拡張した。
論文 参考訳(メタデータ) (2020-07-20T17:50:30Z) - On the Complexity of Minimizing Convex Finite Sums Without Using the
Indices of the Individual Functions [62.01594253618911]
有限和の有限ノイズ構造を利用して、大域オラクルモデルの下での一致する$O(n2)$-upper境界を導出する。
同様のアプローチを踏襲したSVRGの新規な適応法を提案し、これはオラクルと互換性があり、$tildeO(n2+nsqrtL/mu)log (1/epsilon)$と$O(nsqrtL/epsilon)$, for $mu>0$と$mu=0$の複雑さ境界を実現する。
論文 参考訳(メタデータ) (2020-02-09T03:39:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。