論文の概要: Is Child-Directed Language Optimized for Word Learning? A Computational Study of Verb Meaning Acquisition
- arxiv url: http://arxiv.org/abs/2605.12047v1
- Date: Tue, 12 May 2026 12:26:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.855124
- Title: Is Child-Directed Language Optimized for Word Learning? A Computational Study of Verb Meaning Acquisition
- Title(参考訳): 幼児向け言語は語学学習に最適か? : 動詞意味習得の計算的研究
- Authors: Francesca Padovani, Jaap Jumelet, Yevgen Matusevych, Arianna Bisazza,
- Abstract要約: 子ども指向言語(CDL)が言語学習を支援するために最適化されているかを検討する。
CDLと音声ADLでトレーニングしたモデルでは,文字入力でトレーニングしたモデルよりも高いレジリエンスを示した。
- 参考スコア(独自算出の注目度): 10.370896360498644
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Is child-directed language (CDL) optimized to support language learning, and which aspects of linguistic development does it facilitate? We investigate this question using neural language models trained on CDL versus adult-directed language (ADL). We selectively remove syntactic or lexical co-occurrence information from the model training data, and evaluate the impact of these manipulations on verb meaning acquisition. While disrupting syntax impairs learning across all datasets, models trained on CDL and spoken ADL show significantly higher resilience than those trained on written input. Tracking semantic and syntactic performance over training, we observe a semantic-first trajectory, with verb meanings emerging prior to robust syntactic proficiency, an asynchrony most pronounced in the spoken domain, especially CDL. These results suggest that the advantage for verb learning previously attributed to CDL may instead reflect broader properties of the spoken register, rather than a uniquely CDL-specific optimization.
- Abstract(参考訳): 子ども指向言語(CDL)は、言語学習をサポートするために最適化されているか。
本稿では,CDLと成人指向言語(ADL)を訓練したニューラル言語モデルを用いて,この問題を考察する。
モデル学習データから構文的・語彙的共起情報を選択的に除去し,これらの操作が動詞の意味獲得に与える影響を評価する。
構文の破壊はすべてのデータセットで学習を阻害するが、CDLと音声ADLでトレーニングされたモデルは、手書き入力でトレーニングされたモデルよりもはるかに高いレジリエンスを示す。
本研究は,音声領域,特にCDLにおいて最も発音される同音節である,頑健な統語能力に先行して動詞の意味が出現する意味第一の軌跡を学習中に追跡する。
これらの結果から,従来CDLに起因していた動詞学習の利点は,CDL固有の最適化ではなく,音声レジスタのより広い特性を反映している可能性が示唆された。
関連論文リスト
- Do Syntactic Categories Help in Developmentally Motivated Curriculum Learning for Language Models? [22.306066892204274]
本研究では, BabyLM corpus と CHILDES の年齢群を解析した。
CHILDESは, 年齢による統語的区別が強くないが, 学習データに関する統語的知識は, 言語課題におけるモデル性能の解釈に有用であることを示す。
論文 参考訳(メタデータ) (2025-11-11T13:03:27Z) - Child-Directed Language Does Not Consistently Boost Syntax Learning in Language Models [5.636296752147828]
英語の児童指向言語(CDL)で訓練された言語モデルは、成人向けテキストの多量化に基づいて訓練されたLMと同様の構文能力に達することを示す。
我々は、CDLとウィキペディアで訓練されたモデルを、2つのLM目標(masked and causal)、3つの言語(英語、フランス語、ドイツ語)、3つの構文的最小ペアベンチマークで比較することによって、これを検証した。
これらのベンチマークの結果,CDLの非一貫性の利点が示され,ほとんどの場合,ウィキペディアモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-29T17:25:36Z) - From Babbling to Fluency: Evaluating the Evolution of Language Models in Terms of Human Language Acquisition [6.617999710257379]
本稿では,LMの能力を評価するための3段階のフレームワークを提案する。
言語研究の手法を用いて, LMの生成能力を評価する。
論文 参考訳(メタデータ) (2024-10-17T06:31:49Z) - A systematic investigation of learnability from single child linguistic input [12.279543223376935]
言語モデル(LM)は言語的に一貫性のあるテキストを生成するのに顕著な能力を示した。
しかし、これらのモデルのトレーニングデータと、子供が受ける言語的入力との間には、大きなギャップがある。
本研究は, 一人の子どもの言語入力のサブセットに基づいて, LMを訓練することに焦点を当てた。
論文 参考訳(メタデータ) (2024-02-12T18:58:58Z) - Leveraging Code to Improve In-context Learning for Semantic Parsing [48.66031267718704]
In-context Learning (ICL) は、その少数ショットの性質と一般化の改善により、意味解析に魅力的なアプローチである。
我々は,(1)DSLの代わりにPythonなどの汎用プログラミング言語を用いた意味解析におけるICLの有効性を向上し,(2)ドメイン記述を構造化したプロンプトを増強する。
論文 参考訳(メタデータ) (2023-11-16T02:50:06Z) - Evaluating Neural Language Models as Cognitive Models of Language
Acquisition [4.779196219827507]
我々は、ニューラルネットワークモデルの構文能力を評価するための最も顕著なベンチマークは、十分に厳密でないかもしれないと論じる。
小規模データモデリングによる子言語習得を訓練すると、LMは単純なベースラインモデルで容易にマッチングできる。
子どもの言語習得に関する実証的研究と、LMをよりよく結びつけるための提案をまとめて締めくくった。
論文 参考訳(メタデータ) (2023-10-31T00:16:17Z) - Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.7950860342515]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。
しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。
より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか?
本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文 参考訳(メタデータ) (2023-10-20T03:33:36Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Translate to Disambiguate: Zero-shot Multilingual Word Sense
Disambiguation with Pretrained Language Models [67.19567060894563]
事前訓練された言語モデル(PLM)は、豊富な言語間知識を学習し、多様なタスクでうまく機能するように微調整することができる。
C-WLT(Contextual Word-Level Translation)を用いた言語間単語感覚の捉え方の検討を行った。
モデルのサイズが大きくなるにつれて、PLMはより言語間単語認識の知識をエンコードし、WLT性能を改善するためのコンテキストを良くする。
論文 参考訳(メタデータ) (2023-04-26T19:55:52Z) - Towards Language Modelling in the Speech Domain Using Sub-word
Linguistic Units [56.52704348773307]
音節や音素を含む言語単位に基づくLSTMに基づく新しい生成音声LMを提案する。
限られたデータセットでは、現代の生成モデルで要求されるものよりも桁違いに小さいので、我々のモデルはバブリング音声を近似する。
補助的なテキストLM,マルチタスク学習目標,補助的な調音特徴を用いた訓練の効果を示す。
論文 参考訳(メタデータ) (2021-10-31T22:48:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。