論文の概要: A Computational Model of Early Word Learning from the Infant's Point of
View
- arxiv url: http://arxiv.org/abs/2006.02802v1
- Date: Thu, 4 Jun 2020 12:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 10:08:26.087190
- Title: A Computational Model of Early Word Learning from the Infant's Point of
View
- Title(参考訳): 幼児の視点からの初期単語学習の計算モデル
- Authors: Satoshi Tsutsui, Arjun Chandrasekaran, Md Alimoor Reza, David
Crandall, Chen Yu
- Abstract要約: 本研究では,親との遊戯中に幼児の学習者から収集したエゴセントリックな映像と視線データを用いた。
次に、畳み込みニューラルネットワーク(CNN)モデルを用いて、幼児の視点から感覚データを処理し、スクラッチから名前とオブジェクトの関連を学習した。
本研究は,幼児期の単語学習をシミュレートするために生のエゴセントリックビデオを利用する最初のモデルとして,早期語学習の問題を解くことができるという原理の証明を提供する。
- 参考スコア(独自算出の注目度): 15.443815646555125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human infants have the remarkable ability to learn the associations between
object names and visual objects from inherently ambiguous experiences.
Researchers in cognitive science and developmental psychology have built formal
models that implement in-principle learning algorithms, and then used
pre-selected and pre-cleaned datasets to test the abilities of the models to
find statistical regularities in the input data. In contrast to previous
modeling approaches, the present study used egocentric video and gaze data
collected from infant learners during natural toy play with their parents. This
allowed us to capture the learning environment from the perspective of the
learner's own point of view. We then used a Convolutional Neural Network (CNN)
model to process sensory data from the infant's point of view and learn
name-object associations from scratch. As the first model that takes raw
egocentric video to simulate infant word learning, the present study provides a
proof of principle that the problem of early word learning can be solved, using
actual visual data perceived by infant learners. Moreover, we conducted
simulation experiments to systematically determine how visual, perceptual, and
attentional properties of infants' sensory experiences may affect word
learning.
- Abstract(参考訳): 人間の幼児は、本質的に曖昧な経験から、オブジェクト名と視覚的オブジェクトの関係を学習する驚くべき能力を持っている。
認知科学と発達心理学の研究者は、原則内学習アルゴリズムを実装する形式モデルを構築し、その後、事前選択されたデータセットと事前クリーニングデータセットを使用して、入力データから統計的正規性を見つけるモデルの能力をテストする。
従来のモデリング手法とは対照的に,本研究では,親との遊戯中に幼児学習者から収集した自我中心のビデオと視線データを用いた。
これにより,学習者自身の視点から学習環境を捉えることができた。
次に、畳み込みニューラルネットワーク(CNN)モデルを用いて、幼児の視点から感覚データを処理し、スクラッチから名前オブジェクト関連を学習した。
本研究は,幼児の単語学習をシミュレートするために生のエゴセントリックビデオを利用する最初のモデルとして,幼児の学習者が知覚する実際の視覚データを用いて,早期の単語学習の問題を解決できることを示す。
さらに,幼児の知覚経験の視覚的,知覚的,注意的特性が単語学習に与える影響を体系的に評価するシミュレーション実験を行った。
関連論文リスト
- Neural Lineage [56.34149480207817]
本稿では,親子間の系統関係の発見を目的としたニューラルライン検出という新しいタスクを提案する。
実用上,ニューラルネットワーク表現類似度指標に微調整プロセスの近似を組み込んだ学習自由アプローチを導入する。
精度を追求するために,エンコーダと変圧器検出器からなる学習系系統検出装置を導入する。
論文 参考訳(メタデータ) (2024-06-17T01:11:53Z) - A model of early word acquisition based on realistic-scale audiovisual naming events [10.047470656294333]
音声知覚入力における正規性からの統計的学習により,早期語が獲得できる範囲について検討した。
生音声の統計的規則性や画素レベルの視覚入力から学習するモデルを用いて,12ヵ月までの幼児の語学学習を現実的な環境でシミュレーションした。
以上の結果から, 幼児期と同等の語彙成長速度で, 単語の認識とそれに対応する視覚オブジェクトの関連付けを効果的に学習できることが示唆された。
論文 参考訳(メタデータ) (2024-06-07T21:05:59Z) - Modeling User Preferences via Brain-Computer Interfacing [54.3727087164445]
我々はBrain-Computer Interface技術を用いてユーザの好みを推測し、その注意力は視覚的コンテンツと感情的体験との関連性に相関する。
我々はこれらを,情報検索,生成モデルのパーソナライズされたステアリング,感情経験のクラウドソーシング人口推定など,関連するアプリケーションにリンクする。
論文 参考訳(メタデータ) (2024-05-15T20:41:46Z) - Self-supervised learning of video representations from a child's perspective [27.439294457852423]
子どもたちは、エゴセントリックな視覚経験から、周囲の強力な内部モデルを学びます。
そのような内部モデルは、高度に汎用的な学習アルゴリズムで子どもの視覚経験から学べるか、あるいは強い帰納的バイアスを必要とするのか?
論文 参考訳(メタデータ) (2024-02-01T03:27:26Z) - Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.7950860342515]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。
しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。
より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか?
本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文 参考訳(メタデータ) (2023-10-20T03:33:36Z) - SINC: Self-Supervised In-Context Learning for Vision-Language Tasks [64.44336003123102]
大規模言語モデルにおけるコンテキスト内学習を実現するためのフレームワークを提案する。
メタモデルは、カスタマイズされたデモからなる自己教師型プロンプトで学ぶことができる。
実験の結果、SINCは様々な視覚言語タスクにおいて勾配に基づく手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-15T08:33:08Z) - Learning high-level visual representations from a child's perspective
without strong inductive biases [21.466000613898988]
我々は、子どもの視覚体験のリアルなプロキシ上で、明示的な監督なしに最先端のニューラルネットワークを訓練する。
埋め込みモデルと生成モデルの両方を、1人の子供から200時間のヘッドカムビデオでトレーニングします。
同じデータで訓練された生成モデルは、部分的にマスキングされたオブジェクトの単純な性質を外挿することに成功しました。
論文 参考訳(メタデータ) (2023-05-24T17:26:59Z) - A Visuospatial Dataset for Naturalistic Verb Learning [18.654373173232205]
基礎言語モデルのトレーニングと評価のための新しいデータセットを導入する。
我々のデータはバーチャルリアリティー環境で収集され、言語データの品質をエミュレートするように設計されている。
収集したデータを用いて、動詞学習のための複数の分布意味論モデルを比較する。
論文 参考訳(メタデータ) (2020-10-28T20:47:13Z) - What Can You Learn from Your Muscles? Learning Visual Representation
from Human Interactions [50.435861435121915]
視覚のみの表現よりも優れた表現を学べるかどうかを調べるために,人間のインタラクションとアテンション・キューを用いている。
実験の結果,我々の「音楽監督型」表現は,視覚のみの最先端手法であるMoCoよりも優れていた。
論文 参考訳(メタデータ) (2020-10-16T17:46:53Z) - Evaluating computational models of infant phonetic learning across
languages [31.587496924289972]
生後1年で、幼児の発話知覚は母語の音に直感するようになる。
この初期の音声学習に関する多くの説明は存在するが、幼児の音声入力から観察されるパターンを予測する計算モデルは欠如している。
本稿では,その認知関連性について選択した5つのアルゴリズムについて検討する。各アルゴリズムで音素学習をシミュレートし,異なる言語による3つの音声コントラストのテストを行い,その結果を幼児の識別パターンと比較する。
論文 参考訳(メタデータ) (2020-08-06T22:07:45Z) - A Developmental Neuro-Robotics Approach for Boosting the Recognition of
Handwritten Digits [91.3755431537592]
近年のエビデンスでは、子どもの体現戦略をシミュレーションすることで、マシンインテリジェンスも改善できることが示されている。
本稿では,発達神経ロボティクスの文脈における畳み込みニューラルネットワークモデルへの具体的戦略の適用について検討する。
論文 参考訳(メタデータ) (2020-03-23T14:55:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。