論文の概要: Child-directed speech facilitates production, not comprehension, in BabyLMs
- arxiv url: http://arxiv.org/abs/2606.01045v1
- Date: Sun, 31 May 2026 06:27:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.165791
- Title: Child-directed speech facilitates production, not comprehension, in BabyLMs
- Title(参考訳): BabyLMにおける子指向音声は理解ではなく生産を促進する
- Authors: Bastian Bunzeck, Sina Zarrieß,
- Abstract要約: 本稿では,言語習得の用法に基づく理論に触発された新世代評価を提案する。
我々は,CDS,BabyLMコーパス,Webcrawlデータ(FineWeb-edu)を用いて学習したLlamaモデルを,包括的ベンチマークと新しいフレームワーク上で比較した。
この結果から,モデルの理解能力と生産能力との明確な解離が明らかとなった。
- 参考スコア(独自算出の注目度): 10.0983193189508
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent studies suggest that child-directed speech is not conducive to language learning in BabyLMs. However, current evaluations focus predominantly on comprehension and not production, which is central to usage-based theories of language acquisition which argue how CDS facilitates early language use through constructional ''frames'' (frequent lexical patterns with open slots). We introduce a novel generation-based evaluation inspired by such theories in form of a frame-completion task, and compare Llama models trained with CDS, the BabyLM corpus, and web-crawl data (FineWeb-edu) on comprehension benchmarks and our novel framework. Our results reveal a clear dissociation between models' comprehension and production capabilities: while FineWeb-trained models excel at minimal pairs, CDS-trained models produce grammatical completions substantially earlier in training and concentrate probability mass on appropriate slot-fillers. These findings show that comprehension benchmarks underestimate what CDS affords to BabyLMs.
- Abstract(参考訳): 近年の研究では、児童指向音声はBabyLMの言語学習に寄与していないことが示唆されている。
しかし、現在の評価は主に理解と生産に焦点を合わせており、これはCDSが建設的な「フレーム」(開きスロットを持つ頻繁な語彙パターン)を通して、いかに早期の言語利用を促進するかを論じる言語習得の用法に基づく理論の中心である。
本稿では,CDS, BabyLMコーパス, ウェブクローリングデータ(FineWeb-edu)を用いて学習したLlamaモデルと, 包括的ベンチマークと新しいフレームワークについて比較した。
FineWebで学習したモデルは最小ペアで学習するのに対し、CDSで学習したモデルはトレーニングのかなり早い段階で文法的な完成度を生成し、適切なスロットフィラーに確率質量を集中させる。
これらの結果から,CDSがBabyLMに与える影響を,理解的ベンチマークが過小評価していることが示唆された。
関連論文リスト
- Benchmarking Training Paradigms, Dataset Composition, and Model Scaling for Child ASR in ESPnet [72.53502346791814]
データセット、SSL表現(WavLM、XEUS)、デコーダアーキテクチャ間のフラットスタートトレーニングを比較した。
SSL表現は成人のスピーチに偏りがあり、子どものスピーチに対するフラットスタートトレーニングはこれらのバイアスを緩和する。
年齢関連ASRと話者検証分析は、プロプライエタリモデルの限界を強調している。
論文 参考訳(メタデータ) (2025-08-22T17:59:35Z) - Speech-IFEval: Evaluating Instruction-Following and Quantifying Catastrophic Forgetting in Speech-Aware Language Models [49.1574468325115]
本稿では,命令追従能力を評価するための評価フレームワークであるSpeech-IFevalを紹介する。
近年のSLMは,音声認識を大規模言語モデル (LLM) と統合し,音声中心の訓練によるテキスト能力の低下を招いている。
以上の結果から, SLM はテキストベースの LLM よりもはるかに高い性能を示し, 基本命令にも耐え難いことが示唆された。
論文 参考訳(メタデータ) (2025-05-25T08:37:55Z) - BabyVLM: Data-Efficient Pretraining of VLMs Inspired by Infant Learning [33.64851748019174]
ヒトの幼児は、最小限の入力から視覚的推論スキルを急速に発達させる。
最近の取り組みは、SAYCamのような幼児にインスパイアされたデータセットを活用している。
包括的ドメイン評価ベンチマークと合成トレーニングデータセットからなる新しいフレームワークであるBabyVLMを提案する。
論文 参考訳(メタデータ) (2025-04-13T04:17:12Z) - BAMBI: Developing Baby Language Models for Italian [45.36413940519089]
本稿では,5歳児のイタリア語話者の言語入力を模倣したデータに基づいて学習したBAMBI(Baby Language Models Boostrapped for Italian)について述べる。
BAMBIモデルは、受信したモデルのトレーニング入力量を考慮して、言語モデルを評価するために特別に設計されたベンチマークを使用してテストされる。
論文 参考訳(メタデータ) (2025-03-12T15:36:50Z) - MACT: Model-Agnostic Cross-Lingual Training for Discourse Representation Structure Parsing [4.536003573070846]
意味表現解析モデルのための言語間学習戦略を導入する。
事前訓練された言語モデルにエンコードされた言語間のアライメントを利用する。
実験では、英語、ドイツ語、イタリア語、オランダ語におけるDRS節とグラフ解析の大幅な改善が示されている。
論文 参考訳(メタデータ) (2024-06-03T07:02:57Z) - Evaluating Neural Language Models as Cognitive Models of Language
Acquisition [4.779196219827507]
我々は、ニューラルネットワークモデルの構文能力を評価するための最も顕著なベンチマークは、十分に厳密でないかもしれないと論じる。
小規模データモデリングによる子言語習得を訓練すると、LMは単純なベースラインモデルで容易にマッチングできる。
子どもの言語習得に関する実証的研究と、LMをよりよく結びつけるための提案をまとめて締めくくった。
論文 参考訳(メタデータ) (2023-10-31T00:16:17Z) - Expedited Training of Visual Conditioned Language Generation via
Redundancy Reduction [61.16125290912494]
$textEVL_textGen$は、視覚条件付き言語生成モデルの事前トレーニング用に設計されたフレームワークである。
提案手法は,視覚言語モデルの学習を5倍に加速させるが,全体的な性能に顕著な影響を与えないことを示す。
論文 参考訳(メタデータ) (2023-10-05T03:40:06Z) - SINC: Self-Supervised In-Context Learning for Vision-Language Tasks [64.44336003123102]
大規模言語モデルにおけるコンテキスト内学習を実現するためのフレームワークを提案する。
メタモデルは、カスタマイズされたデモからなる自己教師型プロンプトで学ぶことができる。
実験の結果、SINCは様々な視覚言語タスクにおいて勾配に基づく手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-15T08:33:08Z) - Masked Language Modeling and the Distributional Hypothesis: Order Word
Matters Pre-training for Little [74.49773960145681]
マスク言語モデル(MLM)トレーニングの印象的なパフォーマンスの可能な説明は、そのようなモデルがNLPパイプラインで広く普及している構文構造を表現することを学びました。
本稿では,先行訓練がダウンストリームタスクでほぼ完全に成功する理由として,高次単語共起統計をモデル化できることを挙げる。
以上の結果から,純粋分布情報は,事前学習の成功を主に説明し,深い言語知識を必要とする難易度評価データセットのキュレーションの重要性を強調する。
論文 参考訳(メタデータ) (2021-04-14T06:30:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。