論文の概要: On the class of coding optimality of human languages and the origins of Zipf's law
- arxiv url: http://arxiv.org/abs/2505.20015v1
- Date: Mon, 26 May 2025 14:05:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.491202
- Title: On the class of coding optimality of human languages and the origins of Zipf's law
- Title(参考訳): 人間の言語の符号化最適性のクラスとZipfの法則の起源について
- Authors: Ramon Ferrer-i-Cancho,
- Abstract要約: コーディングシステムに最適な新しいクラスを提示する。
Zipfの法則、サイズランク法則、サイズ確率法則は群のような構造を形成する。
Zipfの法則と十分な一致を示すすべての言語は、クラスのメンバーである可能性がある。
- 参考スコア(独自算出の注目度): 0.16317061277456998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Here we present a new class of optimality for coding systems. Members of that class are separated linearly from optimal coding and thus exhibit Zipf's law, namely a power-law distribution of frequency ranks. Whithin that class, Zipf's law, the size-rank law and the size-probability law form a group-like structure. We identify human languages that are members of the class. All languages showing sufficient agreement with Zipf's law are potential members of the class. In contrast, there are communication systems in other species that cannot be members of that class for exhibiting an exponential distribution instead but dolphins and humpback whales might. We provide a new insight into plots of frequency versus rank in double logarithmic scale. For any system, a straight line in that scale indicates that the lengths of optimal codes under non-singular coding and under uniquely decodable encoding are separated by a linear function whose slope is the exponent of Zipf's law. For systems under compression and constrained to be uniquely decodable, such a straight line may indicate that the system is coding close to optimality. Our findings provide support for the hypothesis that Zipf's law originates from compression.
- Abstract(参考訳): ここでは、符号化システムに最適な新しいクラスを示す。
そのクラスのメンバーは最適な符号化から線形に分離され、したがってZipfの法則、すなわち周波数ランクの法則分布を示す。
このクラス、Zipfの法則、サイズランク法則、サイズ確率法則は群のような構造を形成する。
クラスのメンバーである人間の言語を特定します。
Zipfの法則と十分な一致を示すすべての言語は、クラスのメンバーである可能性がある。
対照的に、他の種には、イルカやハチクジラよりも指数関数的な分布を示すために、そのクラスのメンバーにはなり得ないコミュニケーションシステムが存在する。
二重対数スケールにおける周波数対ランクのプロットに関する新しい知見を提供する。
任意の系に対して、このスケールの直線は、非特異な符号化と一意にデオード可能な符号化の下での最適符号の長さが、勾配がZipfの法則の指数である線形関数によって分離されることを示している。
圧縮されたシステムが一意にデオード可能であるように制約された場合、そのような直線はシステムが最適に近くコーディングされていることを示す可能性がある。
本研究は、Zipfの法則が圧縮に由来するという仮説を支持するものである。
関連論文リスト
- Is Compression Really Linear with Code Intelligence? [60.123628177110206]
textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。
我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。
私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文 参考訳(メタデータ) (2025-05-16T16:59:14Z) - Letting the tiger out of its cage: bosonic coding without concatenation [3.2055955766884465]
猫符号は、ハードウェア効率の良いフォールトトレラント量子計算のための有望な道を提供する単一のフォトニックモードまたはフォニックモードに符号化されている。
量子ロータ符号のホモロジー条件を満たす2つの整数行列を用いて、同様の線形制約を持つ多重モード符号を構築する。
ペアキャット符号と同様に、シンドローム抽出は現在の超伝導回路設計による散逸を安定化させることなくタンデムで行うことができる。
論文 参考訳(メタデータ) (2024-11-14T18:38:33Z) - Equivalence Classes of Quantum Error-Correcting Codes [49.436750507696225]
量子過程に影響を与える固有のノイズに対処するために、量子誤り訂正符号(QECC)が必要である。
我々は、テンソルネットワークからなるZXダイアグラムと呼ばれる形式でQECCを表す。
論文 参考訳(メタデータ) (2024-06-17T20:48:43Z) - Factor Graph Optimization of Error-Correcting Codes for Belief Propagation Decoding [62.25533750469467]
低密度パリティ・チェック (LDPC) コードは、他の種類のコードに対していくつかの利点がある。
提案手法は,既存の人気符号の復号性能を桁違いに向上させる。
論文 参考訳(メタデータ) (2024-06-09T12:08:56Z) - Improving Deep Representation Learning via Auxiliary Learnable Target Coding [69.79343510578877]
本稿では,深層表現学習の補助的正規化として,新たな学習対象符号化を提案する。
具体的には、より差別的な表現を促進するために、マージンベースの三重項損失と、提案した目標符号上の相関整合損失を設計する。
論文 参考訳(メタデータ) (2023-05-30T01:38:54Z) - Local Grammar-Based Coding Revisited [0.0]
最小限の局所文法ベースの符号化では、入力文字列は最小出力長が定義された文法として表現される。
我々は、ジップフの法則を思い出させるような、ランク付けされた確率の単純な調和的境界を導出する。
我々は語彙サイズに関する既知の境界を洗練し、相互情報と冗長性による部分的なパワー・ロー同値を示す。
有限語彙が経験的ランクリストである文法ベースのコードを分析し、そのようなコードも普遍的であることを証明した。
論文 参考訳(メタデータ) (2022-09-27T19:05:22Z) - Approximate Bacon-Shor Code and Holography [0.0]
非代数中心を持つホログラフィック量子誤り訂正符号のクラスを明示的に構築する。
ゲージ符号(またはゲージ固定付き安定器符号)を構築するにはベーコン・ソー符号と完全テンソルを用いる。
次に、コード部分空間を「スキーイング」することで、ホログラフィックハイブリッドコードの近似バージョンを構築する。
論文 参考訳(メタデータ) (2020-10-12T18:39:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。