論文の概要: The Distribution of Phoneme Frequencies across the World's Languages: Macroscopic and Microscopic Information-Theoretic Models
- arxiv url: http://arxiv.org/abs/2603.02860v1
- Date: Tue, 03 Mar 2026 11:09:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.75922
- Title: The Distribution of Phoneme Frequencies across the World's Languages: Macroscopic and Microscopic Information-Theoretic Models
- Title(参考訳): 世界言語における音素頻度の分布:マクロ・ミクロ情報理論モデル
- Authors: Fermín Moscoso del Prado Martín, Suchir Salhan,
- Abstract要約: マクロ的には、音素ランク周波数分布は対称ディリクレ分布の順序統計に密接に従っている。
音声、音韻、語彙構造からの制約を組み込んだ最大エントロピーモデルは、言語固有の音素確率を正確に予測する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We demonstrate that the frequency distribution of phonemes across languages can be explained at both macroscopic and microscopic levels. Macroscopically, phoneme rank-frequency distributions closely follow the order statistics of a symmetric Dirichlet distribution whose single concentration parameter scales systematically with phonemic inventory size, revealing a robust compensation effect whereby larger inventories exhibit lower relative entropy. Microscopically, a Maximum Entropy model incorporating constraints from articulatory, phonotactic, and lexical structure accurately predicts language-specific phoneme probabilities. Together, these findings provide a unified information-theoretic account of phoneme frequency structure.
- Abstract(参考訳): 言語間の音素の周波数分布は, マクロと顕微鏡の両方で説明できることを示した。
マクロ的には、音素のランク周波数分布は、単一の濃度パラメータが音素のインベントリサイズと体系的にスケールする対称ディリクレ分布の順序統計に密接に従い、より大きなインベントリがより低いエントロピーを示す堅牢な補償効果を示す。
音韻,音韻,語彙構造からの制約を取り入れた最大エントロピーモデルは,言語固有の音素確率を正確に予測する。
これらの知見を合わせて,音素周波数構造に関する統合情報理論の考察を行った。
関連論文リスト
- Multilingual Dysarthric Speech Assessment Using Universal Phone Recognition and Language-Specific Phonemic Contrast Modeling [22.333214778384487]
変形を伴う神経疾患の流行は、自動的な知能評価方法の必要性を動機付けている。
本稿では,音声認識と言語固有の音素解釈を統合した多言語音素生成評価フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T03:12:11Z) - The Harmonic Structure of Information Contours [54.38365999922221]
我々は、英語、スペイン語、ドイツ語、オランダ語、バスク語、ブラジルポルトガル語のテキストで、周期的な情報レートのパターンが一貫した証拠を見出した。
多くの支配的な周波数は談話構造と一致しており、これらの振動は意味のある言語組織を反映していることを示唆している。
論文 参考訳(メタデータ) (2025-06-04T12:56:30Z) - Bigger Isn't Always Memorizing: Early Stopping Overparameterized Diffusion Models [56.032091696552094]
自然データ領域の一般化は、記憶の開始前に訓練中に徐々に達成される。
一般化対メモ化は、時間スケール間の競合として最もよく理解される。
この現象学は,確率論的文脈自由文法をランダムな規則で学習する拡散モデルにおいて復元されることを示す。
論文 参考訳(メタデータ) (2025-05-22T17:40:08Z) - Macroscopic states and operations: a generalized resource theory of coherence [6.874745415692133]
我々は、マクロな状態の概念、すなわち、マクロな詳細の粗い表現に焦点を合わせ、マクロな測定結果からのみ推測できる状態として定義する。
我々は、コヒーレンス、熱水性、純度、非対称性の既存の資源理論を統一し、一般化する微視的資源理論を開発する。
論文 参考訳(メタデータ) (2025-04-17T08:28:09Z) - Towards Understanding Text Hallucination of Diffusion Models via Local Generation Bias [76.85949078144098]
本稿では,拡散モデルが個々のシンボルを正しく生成するが,それらを意味のない方法で組み立てるテキスト幻覚に焦点を当てる。
このような現象は,ネットワークの局所的生成バイアスに起因すると考えられる。
また、ハイパーキューブ上の2層学習パリティポイントを含む特定のケースのトレーニングダイナミクスを理論的に解析する。
論文 参考訳(メタデータ) (2025-03-05T15:28:50Z) - Deciphering Acoustic Emission with Machine Learning [0.0]
マイクロピラー圧縮試験における変位雪崩の微視的詳細を推定できる機械学習に基づく手法を提案する。
機械学習アプローチでは,様々な記述子が利用されており,予測における重要性が分析されている。
論文 参考訳(メタデータ) (2024-11-25T22:34:05Z) - Surprise! Uniform Information Density Isn't the Whole Story: Predicting Surprisal Contours in Long-form Discourse [54.08750245737734]
話者は、階層的に構造化された談話モデル内の位置に基づいて、情報率を変調する。
階層的予測器は談話の情報輪郭の重要な予測器であり,深い階層的予測器は浅い予測器よりも予測力が高いことがわかった。
論文 参考訳(メタデータ) (2024-10-21T14:42:37Z) - Transfer Learning from Whisper for Microscopic Intelligibility Prediction [3.5717176646955777]
最先端のマクロモデルでは,大規模深層学習モデルからの伝達学習を用いて音声処理を行う。
音声認識のための最先端深層学習モデルであるWhisperからの伝達学習を顕微鏡的インテリジェンス予測に利用することを検討した。
論文 参考訳(メタデータ) (2024-04-02T08:53:51Z) - Mathematically Modeling the Lexicon Entropy of Emergent Language [1.52292571922932]
我々は、深層学習に基づく創発言語システムにおける辞書エントロピーの数学的モデルとして、FiLexというプロセスを定式化する。
我々は、FiLexがハイパーパラメータとレキシコンエントロピーの正確な相関を予測できる4つの異なる環境を経験的に検証した。
論文 参考訳(メタデータ) (2022-11-28T21:35:24Z) - Deep Neural Convolutive Matrix Factorization for Articulatory
Representation Decomposition [48.56414496900755]
この研究は、コンボリューティブスパース行列分解のニューラル実装を用いて、調音データを解釈可能なジェスチャーとジェスチャースコアに分解する。
音素認識実験も実施され、ジェスチャースコアが実際に音韻情報のコード化に成功していることが示された。
論文 参考訳(メタデータ) (2022-04-01T14:25:19Z) - Differentiable Allophone Graphs for Language-Universal Speech
Recognition [77.2981317283029]
言語ユニバーサル音声認識システムを構築するには、言語間で共有可能な音声の音韻単位を生成する必要がある。
本稿では,音素転写と音声-音素マッピングのみから,音素レベルの監視を導出するための一般的な枠組みを提案する。
我々は,各言語に対する可読確率的音声-音素マッピングを用いた普遍的な電話ベース音声認識モデルを構築した。
論文 参考訳(メタデータ) (2021-07-24T15:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。