論文の概要: The Grammar of Emergent Languages
- arxiv url: http://arxiv.org/abs/2010.02069v2
- Date: Fri, 9 Oct 2020 17:52:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 20:12:57.981857
- Title: The Grammar of Emergent Languages
- Title(参考訳): 創発的な言語の文法
- Authors: Oskar van der Wal, Silvan de Boer, Elia Bruni and Dieuwke Hupkes
- Abstract要約: UGI技術は創発的言語を解析するのに適していることを示す。
次に、典型的な参照ゲーム設定に現れる言語が構文構造を示すかどうかを考察する。
我々の実験は、構造が現れるためには、一定のメッセージ長と語彙サイズが必要であることを実証した。
- 参考スコア(独自算出の注目度): 19.17358904009426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we consider the syntactic properties of languages emerged in
referential games, using unsupervised grammar induction (UGI) techniques
originally designed to analyse natural language. We show that the considered
UGI techniques are appropriate to analyse emergent languages and we then study
if the languages that emerge in a typical referential game setup exhibit
syntactic structure, and to what extent this depends on the maximum message
length and number of symbols that the agents are allowed to use. Our
experiments demonstrate that a certain message length and vocabulary size are
required for structure to emerge, but they also illustrate that more
sophisticated game scenarios are required to obtain syntactic properties more
akin to those observed in human language. We argue that UGI techniques should
be part of the standard toolkit for analysing emergent languages and release a
comprehensive library to facilitate such analysis for future researchers.
- Abstract(参考訳): 本稿では,自然言語解析のために考案されたunsupervised grammar induction (ugi) 手法を用いて,参照ゲームに出現する言語の構文特性について考察する。
提案手法は創発的言語を分析するのに適しており、また、典型的な参照ゲーム設定で出現する言語が構文構造を示すかどうか、また、エージェントが使用可能なシンボルの最大メッセージ長と数にどの程度依存しているかについて検討する。
実験により, 構造形成には一定のメッセージ長と語彙サイズが必要であるが, 人間の言語に類似した構文特性を得るためには, より洗練されたゲームシナリオが必要であることが示された。
UGI技術は創発的言語を解析するための標準ツールキットの一部であり、将来の研究者のためにそのような分析を容易にする包括的ライブラリをリリースすべきである。
関連論文リスト
- Finding Structure in Language Models [3.882018118763685]
この論文は、言語モデルが人間のものと似た文法構造を深く理解しているかどうかに関するものである。
我々は,大規模言語モデルの複雑な性質の理解を深める新しい解釈可能性技術を開発する。
論文 参考訳(メタデータ) (2024-11-25T14:37:24Z) - Exploring syntactic information in sentence embeddings through multilingual subject-verb agreement [1.4335183427838039]
我々は,特定の特性を持つ大規模でキュレートされた合成データを開発するためのアプローチを採っている。
我々は、ブラックバード言語行列(Blackbird Language Matrices)と呼ばれる新しい複数選択タスクとデータセットを使用して、特定の文法構造現象に焦点を当てる。
多言語テキストを一貫した方法で訓練したにもかかわらず、多言語事前学習言語モデルには言語固有の違いがあることが示される。
論文 参考訳(メタデータ) (2024-09-10T14:58:55Z) - ELCC: the Emergent Language Corpus Collection [1.6574413179773761]
Emergent Language Corpus Collection (ELCC)は、緊急通信システムのオープンソース実装から収集されたコーパスのコレクションである。
各コーパスには、ソースコードの特徴を記述したメタデータと、コーパスの分析スイートが添付されている。
論文 参考訳(メタデータ) (2024-07-04T21:23:18Z) - MACT: Model-Agnostic Cross-Lingual Training for Discourse Representation Structure Parsing [4.536003573070846]
意味表現解析モデルのための言語間学習戦略を導入する。
事前訓練された言語モデルにエンコードされた言語間のアライメントを利用する。
実験では、英語、ドイツ語、イタリア語、オランダ語におけるDRS節とグラフ解析の大幅な改善が示されている。
論文 参考訳(メタデータ) (2024-06-03T07:02:57Z) - SenteCon: Leveraging Lexicons to Learn Human-Interpretable Language
Representations [51.08119762844217]
SenteConは、深層言語表現に人間の解釈可能性を導入する方法である。
SenteConは、下流タスクにおける予測性能にほとんど、あるいは全くコストをかからない高レベルな解釈性を提供する。
論文 参考訳(メタデータ) (2023-05-24T05:06:28Z) - Natural Language Decompositions of Implicit Content Enable Better Text
Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - An Empirical Revisiting of Linguistic Knowledge Fusion in Language
Understanding Tasks [33.765874588342285]
構文的・意味的知識を持つ言語モデルの構築は,多くの言語理解タスクにおいて改善されている。
GLUEベンチマークにおいて,解析されたグラフや木を簡単なタスクに置き換える実験的検討を行った。
このことは、利得は明示的な言語的先行によるものではなく、融合層によってもたらされるより機能的な相互作用によるものであることを明らかにしている。
論文 参考訳(メタデータ) (2022-10-24T07:47:32Z) - Dependency Induction Through the Lens of Visual Perception [81.91502968815746]
本稿では,単語の具体性を利用した教師なし文法帰納モデルと,構成的視覚に基づく構成的文法を共同学習する手法を提案する。
実験により,提案した拡張は,文法的サイズが小さい場合でも,現在最先端の視覚的接地モデルよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-09-20T18:40:37Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Constrained Language Models Yield Few-Shot Semantic Parsers [73.50960967598654]
我々は,事前学習された大規模言語モデルの利用を,少ない意味論として検討する。
意味構文解析の目標は、自然言語入力によって構造化された意味表現を生成することである。
言語モデルを用いて、入力を英語に似た制御されたサブ言語にパラフレーズし、対象の意味表現に自動的にマッピングする。
論文 参考訳(メタデータ) (2021-04-18T08:13:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。