論文の概要: A Neural Network Model of Lexical Competition during Infant Spoken Word
Recognition
- arxiv url: http://arxiv.org/abs/2006.00999v1
- Date: Mon, 1 Jun 2020 15:04:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 06:30:21.720299
- Title: A Neural Network Model of Lexical Competition during Infant Spoken Word
Recognition
- Title(参考訳): 幼児期音声認識における語彙競合のニューラルネットワークモデル
- Authors: Mihaela Duta and Kim Plunkett
- Abstract要約: ビジュアルワールドスタディでは、対象とする視覚的文脈で単語を聴くと、幼児と大人は短期間、音韻学的に関連のある項目に視線を向ける。
本稿では、動的に展開する音韻表現を処理し、それらを静的な内部意味と視覚表現にマッピングするニューラルネットワークモデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual world studies show that upon hearing a word in a target-absent visual
context containing related and unrelated items, toddlers and adults briefly
direct their gaze towards phonologically related items, before shifting towards
semantically and visually related ones. We present a neural network model that
processes dynamic unfolding phonological representations and maps them to
static internal semantic and visual representations. The model, trained on
representations derived from real corpora, simulates this early phonological
over semantic/visual preference. Our results support the hypothesis that
incremental unfolding of a spoken word is in itself sufficient to account for
the transient preference for phonological competitors over both unrelated and
semantically and visually related ones. Phonological representations mapped
dynamically in a bottom-up fashion to semantic-visual representations capture
the early phonological preference effects reported in a visual world task. The
semantic-visual preference observed later in such a trial does not require
top-down feedback from a semantic or visual system.
- Abstract(参考訳): 視覚の世界研究では、関連項目や関連しない項目を含む目標抽象視覚文脈で単語を聞くと、幼児と大人は、意味的および視覚的関連項目に移行する前に、一時的に音韻的関連項目に視線を向ける。
本稿では,動的に展開する音韻表現を処理し,それらを静的内部意味と視覚表現にマッピングするニューラルネットワークモデルを提案する。
このモデルは実際のコーパスから派生した表現に基づいて訓練され、意味的/視覚的嗜好よりもこの初期の音韻学をシミュレートする。
本研究は, 音声単語の漸進的展開は, 意味的および視覚的に関連しない単語に対して, 音韻学的競合相手の過渡的嗜好を考慮に入れる上で十分である, という仮説を支持する。
ボトムアップ方式で動的にマッピングされた音韻表現は、視覚世界課題で報告された初期の音韻嗜好効果を捉えている。
このような試行で後に観察される意味的視覚的嗜好は、意味的または視覚的システムからトップダウンのフィードバックを必要としない。
関連論文リスト
- Perception of Phonological Assimilation by Neural Speech Recognition Models [3.4173734484549625]
本稿では、ニューラルネットワーク認識モデルであるWav2Vec2が、同化音をどのように知覚するかを考察する。
心理言語学的刺激を用いて、様々な言語文脈がモデル出力の補償パターンにどのように影響するかを分析する。
論文 参考訳(メタデータ) (2024-06-21T15:58:22Z) - Iconic Gesture Semantics [87.00251241246136]
ジェスチャーの視覚的象徴的モデルの知覚的分類において、情報評価は拡張的な例示(例示)として表される。
視覚コミュニケーションのインスタンスの知覚的分類は、Frege/Montagueフレームワークとは異なる意味の概念を必要とする。
モデル理論評価から動的セマンティックフレームワークにおける推論的解釈まで,ジェスチャ表現の全範囲をカバーするアイコン的ジェスチャセマンティクスが導入された。
論文 参考訳(メタデータ) (2024-04-29T13:58:03Z) - Identifying and interpreting non-aligned human conceptual
representations using language modeling [0.0]
先天性失明は,a-モダル語と知覚関連言語ドメインの両方において概念的再編成を引き起こすことを示す。
視覚障害者は、より強く社会的・認知的な意味と、行動に関連する動詞を関連づける。
一部の動詞では、盲目と盲目の表現は非常に似ている。
論文 参考訳(メタデータ) (2024-03-10T13:02:27Z) - Pretraining on Interactions for Learning Grounded Affordance
Representations [22.290431852705662]
我々はニューラルネットワークを訓練し、シミュレーションされた相互作用において物体の軌道を予測する。
我々のネットワークの潜在表現は、観測された価格と観測されていない価格の両方を区別していることが示される。
提案する手法は,従来の語彙表現の形式的意味概念と統合可能な言語学習の手法である。
論文 参考訳(メタデータ) (2022-07-05T19:19:53Z) - Self-supervised models of audio effectively explain human cortical
responses to speech [71.57870452667369]
我々は、自己教師型音声表現学習の進歩に乗じて、人間の聴覚システムの最先端モデルを作成する。
これらの結果から,ヒト大脳皮質における音声処理の異なる段階に関連する情報の階層構造を,自己教師型モデルで効果的に把握できることが示唆された。
論文 参考訳(メタデータ) (2022-05-27T22:04:02Z) - Learnable Visual Words for Interpretable Image Recognition [70.85686267987744]
モデル予測動作を2つの新しいモジュールで解釈するLearable Visual Words (LVW)を提案する。
意味的な視覚的単語学習は、カテゴリ固有の制約を緩和し、異なるカテゴリ間で共有される一般的な視覚的単語を可能にする。
6つの視覚的ベンチマーク実験により,提案したLVWの精度とモデル解釈における優れた効果が示された。
論文 参考訳(メタデータ) (2022-05-22T03:24:45Z) - Deep Neural Convolutive Matrix Factorization for Articulatory
Representation Decomposition [48.56414496900755]
この研究は、コンボリューティブスパース行列分解のニューラル実装を用いて、調音データを解釈可能なジェスチャーとジェスチャースコアに分解する。
音素認識実験も実施され、ジェスチャースコアが実際に音韻情報のコード化に成功していることが示された。
論文 参考訳(メタデータ) (2022-04-01T14:25:19Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Can phones, syllables, and words emerge as side-products of
cross-situational audiovisual learning? -- A computational investigation [2.28438857884398]
いわゆる潜在言語仮説(LLH)について検討する。
LLHは言語表現学習を、知覚のモダリティ内および横断的な一般的な予測処理に結びつける。
我々は、様々なニューラルネットワークモデルを用いた広範学習シミュレーションにおけるLLHをさらに探求する。
論文 参考訳(メタデータ) (2021-09-29T05:49:46Z) - Decomposing lexical and compositional syntax and semantics with deep
language models [82.81964713263483]
GPT2のような言語変換器の活性化は、音声理解中の脳活動に線形にマップすることが示されている。
本稿では,言語モデルの高次元アクティベーションを,語彙,構成,構文,意味表現の4つのクラスに分類する分類法を提案する。
その結果は2つの結果が浮かび上がった。
まず、構成表現は、語彙よりも広範な皮質ネットワークを募集し、両側の側頭、頭頂、前頭前皮質を包含する。
論文 参考訳(メタデータ) (2021-03-02T10:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。