論文の概要: What Meaning-Form Correlation Has to Compose With
- arxiv url: http://arxiv.org/abs/2012.03833v1
- Date: Mon, 7 Dec 2020 16:33:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 10:13:02.591166
- Title: What Meaning-Form Correlation Has to Compose With
- Title(参考訳): 意味と形態の相関関係は何か
- Authors: Timothee Mickus, Timoth\'ee Bernard, Denis Paperno
- Abstract要約: 3つの言語で意味-形式相関を解析する。
MFC測定では,同義語や非接地語などの言語現象が重なることがわかった。
- 参考スコア(独自算出の注目度): 1.6973426830397942
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Compositionality is a widely discussed property of natural languages,
although its exact definition has been elusive. We focus on the proposal that
compositionality can be assessed by measuring meaning-form correlation. We
analyze meaning-form correlation on three sets of languages: (i) artificial toy
languages tailored to be compositional, (ii) a set of English dictionary
definitions, and (iii) a set of English sentences drawn from literature. We
find that linguistic phenomena such as synonymy and ungrounded stop-words weigh
on MFC measurements, and that straightforward methods to mitigate their effects
have widely varying results depending on the dataset they are applied to. Data
and code are made publicly available.
- Abstract(参考訳): 構成性は自然言語の性質として広く議論されているが、その正確な定義は解明されている。
構成性は意味-形態の相関を測ることで評価できるという提案に焦点をあてる。
i) 合成に適した人工玩具言語, (ii) 英辞書定義のセット, (iii) 文学から引き出された英文のセットの3つの言語について, 意味と形態の相関を解析した。
MFC測定では,同義語や非接地語などの言語現象が重なり,その効果を緩和するための簡単な手法が適用されるデータセットによって大きく異なる結果をもたらすことがわかった。
データとコードは公開されています。
関連論文リスト
- Investigating Idiomaticity in Word Representations [9.208145117062339]
我々は2つの言語(英語とポルトガル語)における様々な水準の慣用性を持つ名詞に焦点をあてる。
そこで本研究では,各名詞の音韻性判定を含む最小対のデータセットについて,タイプレベルとトークンレベルの両方で示す。
AffinityとScaled similarityの詳細なメトリクスセットを定義し、モデルが慣用性の変化につながる可能性のある摂動に対してどれほど敏感であるかを判断する。
論文 参考訳(メタデータ) (2024-11-04T21:05:01Z) - Evaluating Contextualized Representations of (Spanish) Ambiguous Words: A New Lexical Resource and Empirical Analysis [2.2530496464901106]
スペイン語の単言語モデルと多言語BERTモデルを用いて、文脈におけるスペイン語のあいまいな名詞の意味表現を評価する。
様々な BERT ベースの LM の文脈的意味表現は、人間の判断に多少の違いがあるが、ヒトのベンチマークには及ばない。
論文 参考訳(メタデータ) (2024-06-20T18:58:11Z) - AMR4NLI: Interpretable and robust NLI measures from semantic graphs [28.017617759762278]
自然言語推論は、ある前提が与えられた仮説を含むかどうかを問う。
セマンティック構造を比較し、セマンティックな埋め込みやセマンティックグラフの集合を含む前提と仮説を表現する。
本評価では,文脈的埋め込みと意味グラフの両方に価値を見出す。
論文 参考訳(メタデータ) (2023-06-01T17:39:40Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Bridging Natural Language Processing and Psycholinguistics:
computationally grounded semantic similarity datasets for Basque and Spanish [0.0]
本稿では,2つの有名な自然言語処理資源,テキストコーパスと知識ベースに基づく単語類似性データセットを提案する。
現在のデータセットにはバスク語とスペイン語の名詞対の情報が含まれているが、さらに多くの言語に拡張することを意図している。
論文 参考訳(メタデータ) (2023-04-19T12:47:51Z) - Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。
自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文 参考訳(メタデータ) (2022-10-14T02:35:19Z) - Crosslinguistic word order variation reflects evolutionary pressures of
dependency and information locality [4.869029215261254]
世界の言語の約40%は主目的語順であり、約40%は主目的語順である。
単語順の変動は、依存関係の局所性と情報局所性の競合する圧力のバランスの異なる方法を反映していることを示す。
本研究は,言語間の統語構造と使用法が,限られた認知資源下での効率的なコミュニケーションを支援するのに相応しいことを示唆している。
論文 参考訳(メタデータ) (2022-06-09T02:56:53Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Understanding Synonymous Referring Expressions via Contrastive Features [105.36814858748285]
画像とオブジェクトインスタンスレベルでのコントラスト機能を学ぶためのエンドツーエンドのトレーニング可能なフレームワークを開発しています。
提案アルゴリズムをいくつかのベンチマークデータセットで評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-04-20T17:56:24Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Multilingual Irony Detection with Dependency Syntax and Neural Models [61.32653485523036]
これは構文知識からの貢献に焦点を当て、普遍依存スキームに従って構文が注釈付けされた言語資源を活用する。
その結果, 依存性をベースとした微粒な構文情報は, アイロンの検出に有用であることが示唆された。
論文 参考訳(メタデータ) (2020-11-11T11:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。