論文の概要: Big Data and Large Numbers. Interpreting Zipf's Law
- arxiv url: http://arxiv.org/abs/2305.02687v1
- Date: Thu, 4 May 2023 10:03:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 16:11:10.943329
- Title: Big Data and Large Numbers. Interpreting Zipf's Law
- Title(参考訳): ビッグデータと膨大な数です
Zipfの法則の解釈
- Authors: Horia-Nicolai L. Teodorescu
- Abstract要約: ビッグデータにおけるいくつかの経験的事実は、多数の性質の影響である。
Zipfの法則ノイズはそのような人工物の一例である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: It turns out that some empirical facts in Big Data are the effects of
properties of large numbers. Zipf's law noise is an example of such an
artefact. We expose several properties of the power law distributions and of
similar distribution that occur when the population is finite and the rank and
counts of elements in the population are natural numbers. Consequences in the
interpretation of Zipf's law are discussed.
- Abstract(参考訳): ビッグデータのいくつかの実証的な事実は、大量の性質の影響であることがわかった。
Zipfの法則ノイズはそのような人工物の一例である。
我々は、人口が有限で、人口の要素のランクとカウントが自然数であるときに生じる、パワーロー分布と類似した分布のいくつかの性質を暴露する。
Zipfの法則の解釈における結果について議論する。
関連論文リスト
- Hyperbolic Fine-tuning for Large Language Models [56.54715487997674]
本研究では,大規模言語モデル(LLM)の非ユークリッド的特徴について検討する。
トークン埋め込みは高い双曲性を示し,埋め込み空間に木のような構造が潜んでいることを示す。
双曲的低ランク効率微調整法HypLoRAを導入し, 双曲的多様体上で直接低ランク適応を行う。
論文 参考訳(メタデータ) (2024-10-05T02:58:25Z) - Causal Layering via Conditional Entropy [85.01590667411956]
因果発見は、生成した観測可能なデータから観測されていない因果グラフに関する情報を回収することを目的としている。
我々は、条件付きエントロピーオラクルを介してデータにアクセスすることによって、グラフの階層化を回復する方法を提供する。
論文 参考訳(メタデータ) (2024-01-19T05:18:28Z) - Two Phases of Scaling Laws for Nearest Neighbor Classifiers [18.93620861346151]
高速スケーリング法則は、データとモデルサイズを単純に増やすことで、機械学習の問題を解決することができることを意味している。
第1段階では、一般化誤差はデータ次元に指数関数的に依存し、急速に減少する。
論文 参考訳(メタデータ) (2023-08-16T09:28:55Z) - A Zipf's Law-based Text Generation Approach for Addressing Imbalance in
Entity Extraction [19.55959053873699]
本稿では,その量的情報を通して問題を観察し,新たなアプローチを提案する。
実体がある種の共通性を示す一方で、他の実体が不足していることを認識しており、これは単語の量的分布に反映できる。
Zipfの法則は、よく適合した採用として現れ、単語から実体へ移行するために、文書内の単語は、一般的で稀なものとして分類される。
論文 参考訳(メタデータ) (2022-05-25T10:22:14Z) - Maximum entropy quantum state distributions [58.720142291102135]
我々は、保存された量の完全な分布に関する伝統的な熱力学と条件を超える。
その結果、熱状態からの偏差が広い入力分布の極限でより顕著になる量子状態分布が得られた。
論文 参考訳(メタデータ) (2022-03-23T17:42:34Z) - Tight Exponential Analysis for Smoothing the Max-Relative Entropy and
for Quantum Privacy Amplification [56.61325554836984]
最大相対エントロピーとその滑らかなバージョンは、量子情報理論の基本的な道具である。
我々は、精製された距離に基づいて最大相対エントロピーを滑らかにする量子状態の小さな変化の崩壊の正確な指数を導出する。
論文 参考訳(メタデータ) (2021-11-01T16:35:41Z) - Detailed fluctuation theorem bounds apparent violations of the second
law [0.0]
強い詳細なゆらぎ定理は、第二法則の明らかな違反に対して、より低い厳密な境界を意味することを示す。
適用例として, ボソニックモードを介する2つの貯水池間の熱交換問題において発生するエントロピーに対して, 境界が満たされることを確認した。
論文 参考訳(メタデータ) (2021-10-01T19:39:33Z) - Causal Expectation-Maximisation [70.45873402967297]
ポリツリーグラフを特徴とするモデルにおいても因果推論はNPハードであることを示す。
我々は因果EMアルゴリズムを導入し、分類的表現変数のデータから潜伏変数の不確かさを再構築する。
我々は、反事実境界が構造方程式の知識なしにしばしば計算できるというトレンドのアイデアには、目立たずの制限があるように思える。
論文 参考訳(メタデータ) (2020-11-04T10:25:13Z) - Gaussian Process States: A data-driven representation of quantum
many-body physics [59.7232780552418]
我々は、絡み合った多体量子状態をコンパクトに表現するための、新しい非パラメトリック形式を示す。
この状態は、非常にコンパクトで、体系的に即効性があり、サンプリングに効率的である。
また、量子状態に対する普遍的な近似器として証明されており、データセットのサイズが大きくなるにつれて、絡み合った多体状態も捉えることができる。
論文 参考訳(メタデータ) (2020-02-27T15:54:44Z) - The empirical structure of word frequency distributions [0.0]
私は、ほとんどの言語で、ファーストネームが自然なコミュニケーションの分布を形成することを示します。
このパターンは、英語の名詞と動詞のコミュニケーション的分布において複製されることを示す。
論文 参考訳(メタデータ) (2020-01-09T20:52:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。