論文の概要: Language Acquisition is Embodied, Interactive, Emotive: a Research
Proposal
- arxiv url: http://arxiv.org/abs/2105.04633v1
- Date: Mon, 10 May 2021 19:40:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 06:42:02.502314
- Title: Language Acquisition is Embodied, Interactive, Emotive: a Research
Proposal
- Title(参考訳): 言語習得は身体的、インタラクティブ、動機的:研究提案
- Authors: Casey Kennington
- Abstract要約: 音声対話の対話的設定における具体化と感情の役割に関する文献を,児童の言語学習に必要な前提条件として検討する。
我々は,現在のトランスフォーマーモデルと単語レベルの基底モデルを利用する意味論のモデルをスケッチし,私たちの意味モデルを利用するロボット対話システムを説明する。
- 参考スコア(独自算出の注目度): 2.639737913330821
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans' experience of the world is profoundly multimodal from the beginning,
so why do existing state-of-the-art language models only use text as a modality
to learn and represent semantic meaning? In this paper we review the literature
on the role of embodiment and emotion in the interactive setting of spoken
dialogue as necessary prerequisites for language learning for human children,
including how words in child vocabularies are largely concrete, then shift to
become more abstract as the children get older. We sketch a model of semantics
that leverages current transformer-based models and a word-level grounded
model, then explain the robot-dialogue system that will make use of our
semantic model, the setting for the system to learn language, and existing
benchmarks for evaluation.
- Abstract(参考訳): 人類の世界の経験は、最初から非常に多様であり、なぜ既存の最先端言語モデルは、意味を学習し表現するためのモダリティとしてのみテキストを使用するのか?
本稿では, 言語学習の必要条件として, 音声対話の対話的設定におけるエンボディメントと感情の役割について, 子どもが年をとるにつれて, 子どもの言葉がいかに具体的か, より抽象的になるか, といった文献を概説する。
我々は,現在のトランスフォーマーモデルと単語レベルの接地モデルを活用した意味論のモデルをスケッチし,その意味モデルを利用したロボット対話システム,言語学習のためのシステム設定,評価のための既存のベンチマークについて説明する。
関連論文リスト
- Visually Grounded Language Learning: a review of language games,
datasets, tasks, and models [60.2604624857992]
多くのVision+Language (V+L)タスクは、視覚的モダリティでシンボルをグラウンドできるモデルを作成することを目的として定義されている。
本稿では,V+L分野において提案されるいくつかの課題とモデルについて,系統的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-12-05T02:17:29Z) - Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.7950860342515]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。
しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。
より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか?
本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文 参考訳(メタデータ) (2023-10-20T03:33:36Z) - Learning to Model the World with Language [100.76069091703505]
人間と対話し、世界で行動するためには、エージェントは人々が使用する言語の範囲を理解し、それを視覚の世界に関連付ける必要がある。
私たちのキーとなるアイデアは、エージェントが将来を予測するのに役立つ信号として、このような多様な言語を解釈すべきである、ということです。
我々は、将来のテキストや画像表現を予測するマルチモーダル世界モデルを学ぶエージェントであるDynalangでこれをインスタンス化する。
論文 参考訳(メタデータ) (2023-07-31T17:57:49Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - Language-Driven Representation Learning for Robotics [115.93273609767145]
ロボット工学における視覚表現学習の最近の研究は、日々の作業を行う人間の大規模なビデオデータセットから学ぶことの可能性を実証している。
人間のビデオやキャプションから言語による表現学習を行うためのフレームワークを提案する。
我々は、Voltronの言語駆動学習が、特に高レベル制御を必要とするターゲット問題において、先行技術よりも優れていることを発見した。
論文 参考訳(メタデータ) (2023-02-24T17:29:31Z) - What Artificial Neural Networks Can Tell Us About Human Language
Acquisition [47.761188531404066]
自然言語処理のための機械学習の急速な進歩は、人間がどのように言語を学ぶかについての議論を変革する可能性がある。
計算モデルによる学習可能性の関連性を高めるためには,人間に対して大きな優位性を持たず,モデル学習者を訓練する必要がある。
論文 参考訳(メタデータ) (2022-08-17T00:12:37Z) - Explainable Semantic Space by Grounding Language to Vision with
Cross-Modal Contrastive Learning [3.441021278275805]
視覚における言語学習の基盤となる2ストリームモデルを設計する。
このモデルはまず、視覚的表現と言語表現をMS COCOデータセットに合わせることを学習する。
トレーニング後、このモデルの言語ストリームは、視覚的に接地されたセマンティック空間に概念を埋め込むことができるスタンドアロン言語モデルである。
論文 参考訳(メタデータ) (2021-11-13T19:54:15Z) - Word Acquisition in Neural Language Models [0.38073142980733]
ニューラルネットワークモデルは,学習中に個々の単語を習得し,学習曲線を抽出し,600以上の単語の獲得年齢を推定する。
子どもや言語モデルでは, 具体性, 単語長, 語彙クラスの影響が顕著に異なることがわかった。
論文 参考訳(メタデータ) (2021-10-05T23:26:16Z) - A Visuospatial Dataset for Naturalistic Verb Learning [18.654373173232205]
基礎言語モデルのトレーニングと評価のための新しいデータセットを導入する。
我々のデータはバーチャルリアリティー環境で収集され、言語データの品質をエミュレートするように設計されている。
収集したデータを用いて、動詞学習のための複数の分布意味論モデルを比較する。
論文 参考訳(メタデータ) (2020-10-28T20:47:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。