Fugu-MT 論文翻訳(概要): A model of early word acquisition based on realistic-scale audiovisual naming events

論文の概要: A model of early word acquisition based on realistic-scale audiovisual naming events

arxiv url: http://arxiv.org/abs/2406.05259v1
Date: Fri, 7 Jun 2024 21:05:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-11 22:36:11.514798
Title: A model of early word acquisition based on realistic-scale audiovisual naming events
Title（参考訳）: リアルタイムな音声視覚的命名イベントに基づく早期単語獲得モデル
Authors: Khazar Khorrami, Okko Räsänen,
Abstract要約: 音声知覚入力における正規性からの統計的学習により,早期語が獲得できる範囲について検討した。生音声の統計的規則性や画素レベルの視覚入力から学習するモデルを用いて,12ヵ月までの幼児の語学学習を現実的な環境でシミュレーションした。以上の結果から, 幼児期と同等の語彙成長速度で, 単語の認識とそれに対応する視覚オブジェクトの関連付けを効果的に学習できることが示唆された。
参考スコア（独自算出の注目度）: 10.047470656294333
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Infants gradually learn to parse continuous speech into words and connect names with objects, yet the mechanisms behind development of early word perception skills remain unknown. We studied the extent to which early words can be acquired through statistical learning from regularities in audiovisual sensory input. We simulated word learning in infants up to 12 months of age in a realistic setting, using a model that solely learns from statistical regularities in unannotated raw speech and pixel-level visual input. Crucially, the quantity of object naming events was carefully designed to match that accessible to infants of comparable ages. Results show that the model effectively learns to recognize words and associate them with corresponding visual objects, with a vocabulary growth rate comparable to that observed in infants. The findings support the viability of general statistical learning for early word perception, demonstrating how learning can operate without assuming any prior linguistic capabilities.
Abstract（参考訳）: 幼児は徐々に、連続した音声を単語にパースし、名前とオブジェクトを結びつけるように学習するが、初期の単語認識スキルの発達のメカニズムはいまだに不明である。音声知覚入力における正規性からの統計的学習により,早期語が獲得できる範囲について検討した。実年齢12か月までの幼児における単語学習を,無注釈の生音声と画素レベルの視覚入力の統計的規則性からのみ学習するモデルを用いてシミュレートした。重要なことに、オブジェクトの命名イベントの量は、同等の年齢の幼児にアクセスできるものに合わせて慎重に設計されている。以上の結果から, 幼児期と同等の語彙成長速度で, 単語の認識とそれに対応する視覚オブジェクトの関連付けを効果的に学習できることが示唆された。この知見は、早期単語知覚のための一般統計学習の実用性を支持し、学習が事前の言語能力を仮定せずにどのように機能するかを実証する。

関連論文リスト

Assessing the alignment between infants' visual and linguistic experience using multimodal language models [2.275358921334511]
日常学習における子どもの視覚的・言語的経験と時間的整合性について学習のための理想化された整列モーメントは、現代の機械学習データセットと比較して、子供の日常体験において比較的稀であることを示す。これらの結果から, 単語学習を記述したモデルでは, 頻繁なアライメントが制約であることが示唆された。
論文参考訳（メタデータ） (2025-11-24T06:58:16Z)
Developmental Predictive Coding Model for Early Infancy Mono and Bilingual Vocal Continual Learning [69.8008228833895]
本稿では,連続学習機構を備えた小型生成ニューラルネットワークを提案する。我々のモデルは解釈可能性を重視し,オンライン学習の利点を実証する。
論文参考訳（メタデータ） (2024-12-23T10:23:47Z)
Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文参考訳（メタデータ） (2024-02-13T02:46:45Z)
Caregiver Talk Shapes Toddler Vision: A Computational Study of Dyadic Play [8.164232628099619]
本稿では, ディヤドプレイにおける視覚表現学習の計算モデルを提案する。実介護者の統計値に一致した発話は, カテゴリー認識の改善を支援する表現を生じさせることを示す。
論文参考訳（メタデータ） (2023-12-07T08:18:40Z)
Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.7950860342515]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか? 本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文参考訳（メタデータ） (2023-10-20T03:33:36Z)
BabySLM: language-acquisition-friendly benchmark of self-supervised spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文参考訳（メタデータ） (2023-06-02T12:54:38Z)
Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文参考訳（メタデータ） (2022-05-21T16:52:57Z)
Perception Point: Identifying Critical Learning Periods in Speech for Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文参考訳（メタデータ） (2021-10-13T05:30:50Z)
Word Acquisition in Neural Language Models [0.38073142980733]
ニューラルネットワークモデルは,学習中に個々の単語を習得し,学習曲線を抽出し,600以上の単語の獲得年齢を推定する。子どもや言語モデルでは, 具体性, 単語長, 語彙クラスの影響が顕著に異なることがわかった。
論文参考訳（メタデータ） (2021-10-05T23:26:16Z)
Using Diachronic Distributed Word Representations as Models of Lexical Development in Children [0.0]
小児の語彙発達の時系列モデリングと分析を行うために,ダイアクロニック分散語表現を用いる。子ども向け成人音声における語彙知識の飽和レベルと比較し,子どもの語彙知識の成長の動態を時間とともに示す。
論文参考訳（メタデータ） (2021-05-11T14:44:05Z)
Using Known Words to Learn More Words: A Distributional Analysis of Child Vocabulary Development [0.0]
分布統計の語彙特性を用いた語彙発達におけるアイテムベース変動について検討した。単語軌跡を横断的に予測し,語彙発達の傾向に光を当てた。また, 子どもが単語を知っているかどうかの最適な分布予測器は, 単語が共起する傾向にある他の単語の数であることを示す。
論文参考訳（メタデータ） (2020-09-15T01:18:21Z)
A Computational Model of Early Word Learning from the Infant's Point of View [15.443815646555125]
本研究では,親との遊戯中に幼児の学習者から収集したエゴセントリックな映像と視線データを用いた。次に、畳み込みニューラルネットワーク(CNN)モデルを用いて、幼児の視点から感覚データを処理し、スクラッチから名前とオブジェクトの関連を学習した。本研究は,幼児期の単語学習をシミュレートするために生のエゴセントリックビデオを利用する最初のモデルとして,早期語学習の問題を解くことができるという原理の証明を提供する。
論文参考訳（メタデータ） (2020-06-04T12:08:44Z)
On Vocabulary Reliance in Scene Text Recognition [79.21737876442253]
ボキャブラリ内の単語を持つ画像に対して、手法は良好に機能するが、ボキャブラリ外の単語を持つ画像にはあまり一般化しない。私たちはこの現象を「語彙依存」と呼んでいる。本研究では,2家族のモデルが協調的に学習できるようにするための,シンプルで効果的な相互学習戦略を提案する。
論文参考訳（メタデータ） (2020-05-08T11:16:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。