論文の概要: A Computational Operationalisation of Competing Maturational Theories of Syntactic Development via Statistical Grammar Induction
- arxiv url: http://arxiv.org/abs/2605.08476v1
- Date: Fri, 08 May 2026 20:51:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.675142
- Title: A Computational Operationalisation of Competing Maturational Theories of Syntactic Development via Statistical Grammar Induction
- Title(参考訳): 統計的文法誘導による構文発達の競合成熟理論の計算操作
- Authors: Mila Marcheva, Suchir Salhan, Weiwei Sun,
- Abstract要約: 本稿では,第1言語発達の過程で子どもが獲得する中間構文カテゴリーと,どのような順序で取得するかについて考察する。
ボトムアップアカウント(GROWING)は、語彙構造と屈折構造が最初に出現し、内向きアカウント(INWARD)は談話関連カテゴリへの早期アクセスを予測している。
- 参考スコア(独自算出の注目度): 2.604194671270661
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper is concerned with what intermediate syntactic categories children acquire during first language development, and in what order. Maturational theories make different predictions. Bottom-up accounts (GROWING) propose that lexical and inflectional structure emerges first, while inward accounts (INWARD) predict early access to discourse-related categories. We computationally operationalise these hypotheses of staged syntactic emergence using statistical grammar induction, asking what each proposed ordering makes learnable when input and learning algorithm are held constant. Our framework makes category acquisition explicit and allows us to explore how different maturational orderings shape the structure that can be learned under identical conditions. Based on this operationalisation, the GROWING account significantly outperforms the INWARD account across three evaluation metrics.
- Abstract(参考訳): 本稿では,第1言語発達の過程で子どもが獲得する中間構文カテゴリーと,どのような順序で取得するかについて考察する。
成熟理論は異なる予測を行う。
ボトムアップアカウント(GROWING)は、語彙構造と屈折構造が最初に出現し、内向きアカウント(INWARD)は談話関連カテゴリへの早期アクセスを予測している。
統計的文法帰納法を用いて,これらの段階的構文出現の仮説を計算的に操作し,入力と学習アルゴリズムが一定に保たれた場合,各順序がどのような学習可能かを問う。
本フレームワークは,カテゴリ獲得を明確にし,異なる成熟順序が同一条件下で学習可能な構造をどのように形成するかを探索する。
この運用に基づいて、GROWINGアカウントは、3つの評価指標でINWARDアカウントを著しく上回っている。
関連論文リスト
- Latent Reasoning via Sentence Embedding Prediction [41.06552269338159]
本稿では,次の文の連続的な埋め込みを自動回帰予測することにより,事前訓練されたトークンレベルのLMを文空間内での操作に適応させるフレームワークを提案する。
以上の結果から,事前学習したLMは,遅延埋め込み空間内での抽象的構造的推論に効果的に移行できることが示唆された。
論文 参考訳(メタデータ) (2025-05-28T10:28:35Z) - Next-token pretraining implies in-context learning [0.0]
トークンシーケンス、特に非エルゴディックソースでトレーニングされた場合、モデルがどのようにコンテキストに適応するかを示す。
我々の情報理論フレームワークは、これらの分布内ICLダイナミクスを正確に予測する。
また、任意のタスクにおけるモデルのコンテキスト内性能が、事前学習で見られるタスクのアンサンブルと数学的に結合していることを示す。
論文 参考訳(メタデータ) (2025-05-23T21:00:18Z) - Towards Auto-Regressive Next-Token Prediction: In-Context Learning Emerges from Generalization [26.9153121765435]
大規模言語モデル(LLM)は、文脈内学習能力を顕著に示している。
本稿では,ICLの出現と事前学習がICLに与える影響について検討する。
我々の理論は、数値線形力学系、合成GINC、実世界の言語データセットの実験によって支持されている。
論文 参考訳(メタデータ) (2025-02-24T10:26:29Z) - The Foundations of Tokenization: Statistical and Computational Concerns [51.370165245628975]
トークン化は、NLPパイプラインにおける重要なステップである。
NLPにおける標準表現法としての重要性は認識されているが、トークン化の理論的基盤はまだ完全には理解されていない。
本稿では,トークン化モデルの表現と解析のための統一的な形式的枠組みを提案することによって,この理論的ギャップに対処することに貢献している。
論文 参考訳(メタデータ) (2024-07-16T11:12:28Z) - Distributional Associations vs In-Context Reasoning: A Study of Feed-forward and Attention Layers [49.80959223722325]
本研究では,大規模言語モデルにおけるフィードフォワード層とアテンション層との区別について検討する。
フィードフォワード層はビッグラムのような単純な分布関係を学習する傾向があり、注意層は文脈内推論にフォーカスする。
論文 参考訳(メタデータ) (2024-06-05T08:51:08Z) - A Theory of Emergent In-Context Learning as Implicit Structure Induction [8.17811111226145]
大きな言語モデルをスケールすると、実例からコンテキスト内で学習する能力が創発的になる。
文脈内学習は、自然言語データにみられる合成操作の組換えに依拠していると論じる。
入力の合成構造の表現によって、文脈内学習がどうサポートされるかを示す。
論文 参考訳(メタデータ) (2023-03-14T15:24:05Z) - Rationale-Augmented Ensembles in Language Models [53.45015291520658]
我々は、数発のテキスト内学習のための合理化促進策を再考する。
我々は、出力空間における合理的サンプリングを、性能を確実に向上させるキーコンポーネントとして特定する。
有理拡張アンサンブルは既存のプロンプト手法よりも正確で解釈可能な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-07-02T06:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。