論文の概要: Learned Construction Grammars Converge Across Registers Given Increased
Exposure
- arxiv url: http://arxiv.org/abs/2110.05663v1
- Date: Tue, 12 Oct 2021 00:45:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 05:09:33.604718
- Title: Learned Construction Grammars Converge Across Registers Given Increased
Exposure
- Title(参考訳): 学習した構文文法が公開度を高めたレジスタに収束
- Authors: Jonathan Dunn and Harish Tayyar Madabushi
- Abstract要約: 本稿では,学習した構成文法が共有表現に収束するか否かに対する露出増加の影響を計測する。
実験は12言語での言語学習をシミュレートし、コーパスは3つのレジスタを表す。
その結果、露出が増加すると、すべての言語に文法が収束することがわかった。
- 参考スコア(独自算出の注目度): 0.8376091455761259
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper measures the impact of increased exposure on whether learned
construction grammars converge onto shared representations when trained on data
from different registers. Register influences the frequency of constructions,
with some structures common in formal but not informal usage. We expect that a
grammar induction algorithm exposed to different registers will acquire
different constructions. To what degree does increased exposure lead to the
convergence of register-specific grammars? The experiments in this paper
simulate language learning in 12 languages (half Germanic and half Romance)
with corpora representing three registers (Twitter, Wikipedia, Web). These
simulations are repeated with increasing amounts of exposure, from 100k to 2
million words, to measure the impact of exposure on the convergence of
grammars. The results show that increased exposure does lead to converging
grammars across all languages. In addition, a shared core of register-universal
constructions remains constant across increasing amounts of exposure.
- Abstract(参考訳): 本稿では,学習した構文文法が,異なるレジスタのデータに基づいて学習された場合の共有表現に収束するか否かに対する露出の増加の影響を計測する。
登録は建設の頻度に影響し、いくつかの構造は形式的には一般的だが非公式には使われない。
異なるレジスタに露呈する文法帰納アルゴリズムは、異なる構成を得られると期待する。
エクスポージャーの増加はレジスタ固有文法の収束にどの程度つながるのか?
本稿では,12言語(半分はゲルマン語,半分はロマンス語)の言語学習をシミュレートし,コーパスは3つのレジスタ(Twitter,Wikipedia,Web)を表す。
これらのシミュレーションは、文法の収束に対する露出の影響を測定するために、1万語から200万語への露出の増加とともに繰り返される。
その結果,全言語にまたがる文法の収束につながることが明らかとなった。
さらに、レジスタ・ユニバーサル構成の共有コアは、露出の増加とともに一定である。
関連論文リスト
- Grammar Induction from Visual, Speech and Text [91.98797120799227]
本研究は、新しい視覚音声テキスト文法誘導タスク(textbfVAT-GI)を導入する。
言語文法がテキストを超えて存在するという事実に触発されて、テキストは文法帰納において支配的なモダリティであってはならないと論じる。
そこで本稿では,豊富なモーダル特化機能と補完機能を有効文法解析に活用した,ビジュアル・オーディオ・テキスト・インサイド・アウトサイド・オートエンコーダ(textbfVaTiora)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-01T02:24:18Z) - Towards a theory of how the structure of language is acquired by deep neural networks [6.363756171493383]
木のような生成モデルを用いて、自然言語で見られる階層構造の多くをキャプチャする。
トークンとトークンの相関は文法の隠れ変数の表現を構築するのに有効であることを示す。
トレーニングセットのサイズと効果的な相関範囲の関係は、我々の合成データセットを超えていると推測する。
論文 参考訳(メタデータ) (2024-05-28T17:01:22Z) - On the effect of curriculum learning with developmental data for grammar
acquisition [4.4044968357361745]
この研究は、文法習得が言語の単純さによって引き起こされる程度と、データのソースモダリティ(音声対テキスト)について考察する。
特にBabyLMトレーニングコーパス(AO-Childes)とOpen Subtitles(Open Subtitles)の2つを対象とする。
論文 参考訳(メタデータ) (2023-10-31T20:05:30Z) - Exposure and Emergence in Usage-Based Grammar: Computational Experiments
in 35 Languages [0.0]
本稿では,建築文法の出現における露出の役割について考察する。
実験により、語彙は文法よりも急速に成長することが示された。
最近観測されていないとき、建設が忘れられる確率は、建設物の成長率を反映している。
論文 参考訳(メタデータ) (2022-11-25T15:05:36Z) - Multilingual Extraction and Categorization of Lexical Collocations with
Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。
以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文 参考訳(メタデータ) (2022-05-23T16:47:37Z) - Dependency Induction Through the Lens of Visual Perception [81.91502968815746]
本稿では,単語の具体性を利用した教師なし文法帰納モデルと,構成的視覚に基づく構成的文法を共同学習する手法を提案する。
実験により,提案した拡張は,文法的サイズが小さい場合でも,現在最先端の視覚的接地モデルよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-09-20T18:40:37Z) - Production vs Perception: The Role of Individuality in Usage-Based
Grammar Induction [0.0]
生産ベースと知覚ベースの文法誘導の区別は、文法と語彙の成長曲線に影響を与える。
3つの計算実験のセットは、生産ベース文法が全ての条件における知覚ベース文法と大きく異なることを示している。
論文 参考訳(メタデータ) (2021-04-19T03:38:47Z) - VLGrammar: Grounded Grammar Induction of Vision and Language [86.88273769411428]
共同学習枠組みにおける視覚と言語の基底文法誘導について検討する。
本稿では,複合確率文脈自由文法(pcfgs)を用いて言語文法と画像文法を同時に誘導する手法であるvlgrammarを提案する。
論文 参考訳(メタデータ) (2021-03-24T04:05:08Z) - BURT: BERT-inspired Universal Representation from Twin Structure [89.82415322763475]
BURT (BERT inspired Universal Representation from Twin Structure) は任意の粒度の入力シーケンスに対して普遍的で固定サイズの表現を生成することができる。
提案するBURTは,Siameseネットワークを採用し,自然言語推論データセットから文レベル表現を学習し,パラフレーズ化データセットから単語/フレーズレベル表現を学習する。
我々は,STSタスク,SemEval2013 Task 5(a) など,テキスト類似性タスクの粒度によってBURTを評価する。
論文 参考訳(メタデータ) (2020-04-29T04:01:52Z) - Sign Language Transformers: Joint End-to-end Sign Language Recognition
and Translation [59.38247587308604]
本稿では,連続手話認識と翻訳を共同で学習するトランスフォーマーアーキテクチャを提案する。
RWTH-PHOENIX-Weather-2014Tデータセットの認識と翻訳性能の評価を行った。
我々の翻訳ネットワークは、動画を音声言語に、光沢を音声言語翻訳モデルに、どちらよりも優れています。
論文 参考訳(メタデータ) (2020-03-30T21:35:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。