論文の概要: Finding Concept-specific Biases in Form--Meaning Associations
- arxiv url: http://arxiv.org/abs/2104.06325v1
- Date: Tue, 13 Apr 2021 16:07:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 13:33:02.557860
- Title: Finding Concept-specific Biases in Form--Meaning Associations
- Title(参考訳): フォームアソシエーションにおける概念特異的ビアーゼの発見
- Authors: Tiago Pimentel, Brian Roark, S{\o}ren Wichmann, Ryan Cotterell,
Dami\'an Blasi
- Abstract要約: 本研究は,言語間非アービタリティの情報理論的運用について述べる。
非アビタリア性には有意な効果があるが、意外にも小さい(我々の情報理論的な推定では平均で0.5%未満)。
また,本研究で検討されている概念の4分の1が,言語横断的非言語性を示す概念レベル分析も提供する。
- 参考スコア(独自算出の注目度): 39.24277753791032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents an information-theoretic operationalisation of
cross-linguistic non-arbitrariness. It is not a new idea that there are small,
cross-linguistic associations between the forms and meanings of words. For
instance, it has been claimed (Blasi et al., 2016) that the word for "tongue"
is more likely than chance to contain the phone [l]. By controlling for the
influence of language family and geographic proximity within a very large
concept-aligned cross-lingual lexicon, we extend methods previously used to
detect within language non-arbitrariness (Pimentel et al., 2019) to measure
cross-linguistic associations. We find that there is a significant effect of
non-arbitrariness, but it is unsurprisingly small (less than 0.5% on average
according to our information-theoretic estimate). We also provide a
concept-level analysis which shows that a quarter of the concepts considered in
our work exhibit a significant level of cross-linguistic non-arbitrariness. In
sum, the paper provides new methods to detect cross-linguistic associations at
scale.
- Abstract(参考訳): 本研究は,言語間非アービタリティの情報理論的運用について述べる。
語の形と意味の間に小さな言語横断的な関係があることは、新しい考え方ではない。
例えば、Blasi et al., 2016) は、"tongue" という単語は、電話機 [l] を封入する確率よりも高いと主張している。
本研究は,言語非言語性(pimentel et al., 2019)における言語非言語性の検出に用いられる手法を拡張し,言語間関係を測定する。
非アビタラリネスには大きな効果があるが、意外なほど小さい(我々の情報理論的な推定では平均で0.5%以下)。
また,本研究で検討されている概念の4分の1が,言語横断的非言語性を示す概念レベル分析も提供する。
まとめると,本論文は大規模言語間関係を検出する新しい手法を提案する。
関連論文リスト
- Examining Multilingual Embedding Models Cross-Lingually Through LLM-Generated Adversarial Examples [38.18495961129682]
本稿では,大規模セマンティックコーパスを必要としない新たな言語間探索タスクを提案する。
これは、大きな言語モデルによって生成される障害に挑戦するよりも、真の並列文を言語横断的にランク付けするモデルの能力に焦点を当てている。
ニュースドメインにおける言語対であるドイツ語とフランス語のCLSDタスクのケーススタディを作成します。
論文 参考訳(メタデータ) (2025-02-12T18:54:37Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Semi-supervised cross-lingual speech emotion recognition [26.544999411050036]
言語間音声感情認識は、現実世界のアプリケーションでは依然として課題である。
対象領域にラベル付き例がほとんど存在しない場合に,言語間感情認識のための半教師付き学習(SSL)手法を提案する。
提案手法はトランスフォーマーをベースとして,ラベルなし発話の擬似ラベル付け戦略を活用することで,新しいドメインに適応する。
論文 参考訳(メタデータ) (2022-07-14T09:24:55Z) - A Neural Network-Based Linguistic Similarity Measure for Entrainment in
Conversations [12.052672647509732]
言語訓練は、人々が会話でお互いを模倣する傾向がある現象である。
現在の類似度尺度のほとんどは、back-of-wordsアプローチに基づいている。
本稿では,ニューラルネットワークモデルを用いて,運動の類似度を測定することを提案する。
論文 参考訳(メタデータ) (2021-09-04T19:48:17Z) - A Computational Approach to Measuring the Semantic Divergence of
Cognates [2.66418345185993]
複数の言語におけるコグネート集合の意味的類似性を測定することにより、言語間の意味的相違について検討する。
言語に依存しない手法は、コグナットの発散の定量的解析を容易にする。
本研究では,「ソフト・フェイル・フレンド」と「ハード・フェイル・フレンド」の概念を導入するとともに,偽友達ペアの「虚偽」の程度を測る尺度を導入する。
論文 参考訳(メタデータ) (2020-12-02T15:52:38Z) - XL-WiC: A Multilingual Benchmark for Evaluating Semantic
Contextualization [98.61159823343036]
単語の意味を正確にモデル化する能力を評価するために,Word-in-Context データセット (WiC) を提案する。
我々は、XL-WiCという大規模なマルチ言語ベンチマークを提案し、12の新しい言語でゴールドスタンダードを特徴付けました。
実験結果から、ターゲット言語にタグ付けされたインスタンスが存在しない場合でも、英語データのみにトレーニングされたモデルは、競争力のあるパフォーマンスが得られることが示された。
論文 参考訳(メタデータ) (2020-10-13T15:32:00Z) - Leveraging Adversarial Training in Self-Learning for Cross-Lingual Text
Classification [52.69730591919885]
本稿では,ラベル保存型入力摂動の最大損失を最小限に抑える半教師付き対向学習法を提案する。
多様な言語群に対する文書分類と意図分類において,有効性が著しく向上するのを観察する。
論文 参考訳(メタデータ) (2020-07-29T19:38:35Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。