論文の概要: An Algebraic View of the Expressivity of Recurrent Language Models
- arxiv url: http://arxiv.org/abs/2606.01765v2
- Date: Fri, 05 Jun 2026 15:53:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.291123
- Title: An Algebraic View of the Expressivity of Recurrent Language Models
- Title(参考訳): リカレント言語モデルの表現性に関する代数的考察
- Authors: Franz Nowak, Ryan Cotterell, Reda Boumasmoud,
- Abstract要約: 本稿では、繰り返しニューラルネットワークの表現性に関する統一的代数的記述法を開発する。
同じアーキテクチャでは、浮動小数点反復が強制されると偶モジュラーカウンタを実装することはできないが、符号付き整数量子化の下ではすべての偶モジュラーカウンタを実現する。
- 参考スコア(独自算出の注目度): 50.88598486616582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: What formal languages can a recurrent neural language model recognize? Formal results in the literature conflict: some authors report Turing-completeness, while others show equivalence to regular languages. The reason for this discrepancy is that the underlying arithmetic model differs. The paper develops a unified algebraic account of the expressivity of recurrent neural networks, starting with a formal account of various arithmetic models. This account reduces expressivity to an algebraic question, e.g., whether a network's syntactic monoid divides a certain wreath product. As a case study, the paper revisits diagonal state-space models: the same architecture cannot implement an even-modulus counter once floating-point recurrences are enforced, yet realizes every even-modulus counter under unsigned-integer quantization.
- Abstract(参考訳): リカレントニューラル言語モデルが認識できる形式言語は何か?
一部の著者はチューリング完全性を報告し、他の著者は正規言語に同値である。
この違いの理由は、基礎となる算術モデルが異なるからである。
本稿では、様々な算術モデルの形式的記述から始まる、繰り返しニューラルネットワークの表現率の統一的代数的記述を開発する。
この説明は、表現性を代数的問題、例えば、ネットワークの構文的モノイドがある Wreath 積を分割するかどうかに還元する。
同一のアーキテクチャでは、浮動小数点反復が実施されると偶モジュラスカウンタを実装することはできないが、符号付き整数量子化の下では全ての偶モジュラスカウンタを実現する。
関連論文リスト
- Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価する。
3つのニューラルアーキテクチャに対して、チョムスキー階層の様々な言語について結果を提供する。
我々の貢献は、将来の研究において、言語認識の主張を理論的に健全に検証するのに役立つだろう。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - Learning Algebraic Recombination for Compositional Generalization [71.78771157219428]
合成一般化のための代数的組換え学習のためのエンドツーエンドニューラルモデルLeARを提案する。
主要な洞察は、意味解析タスクを潜在構文代数学と意味代数学の間の準同型としてモデル化することである。
2つの現実的・包括的構成一般化の実験は、我々のモデルの有効性を実証している。
論文 参考訳(メタデータ) (2021-07-14T07:23:46Z) - Do Neural Models Learn Systematicity of Monotonicity Inference in
Natural Language? [41.649440404203595]
本稿では,ニューラルネットワークが自然言語の単調推論の体系性を学習できるかどうかを評価する手法を提案する。
単調性推論の4つの側面を考察し、モデルが異なるトレーニング/テスト分割における語彙的および論理的現象を体系的に解釈できるかどうかを検証する。
論文 参考訳(メタデータ) (2020-04-30T14:48:39Z) - On the Linguistic Capacity of Real-Time Counter Automata [1.8072051868187933]
リアルタイムカウンターマシンの能力を形式文法として研究する。
対向言語は補数、和、交叉、その他多くの共通集合演算の下で閉じていることを示す。
この研究は、リカレントニューラルネットワークを理解することに興味のある形式言語理論に一般的な貢献をする。
論文 参考訳(メタデータ) (2020-04-15T03:37:47Z) - Consistency of a Recurrent Language Model With Respect to Incomplete
Decoding [67.54760086239514]
逐次言語モデルから無限長のシーケンスを受信する問題について検討する。
不整合に対処する2つの対策として、トップkと核サンプリングの一貫性のある変種と、自己終端の繰り返し言語モデルを提案する。
論文 参考訳(メタデータ) (2020-02-06T19:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。