論文の概要: When is Wall a Pared and when a Muro? -- Extracting Rules Governing
Lexical Selection
- arxiv url: http://arxiv.org/abs/2109.06014v1
- Date: Mon, 13 Sep 2021 14:49:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:44:02.490321
- Title: When is Wall a Pared and when a Muro? -- Extracting Rules Governing
Lexical Selection
- Title(参考訳): 壁はいつ、室はいつ?
--語彙選択を規定する規則の抽出
- Authors: Aditi Chaudhary, Kayo Yin, Antonios Anastasopoulos, Graham Neubig
- Abstract要約: 本稿では,微細な語彙の区別を自動的に識別する手法を提案する。
我々は、これらの区別を説明する簡潔な記述を、人間と機械で読める形式で抽出する。
我々はこれらの記述を用いて、与えられた曖昧な単語を異なる可能な翻訳に翻訳する時、非ネイティブ話者に教える。
- 参考スコア(独自算出の注目度): 85.0262994506624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning fine-grained distinctions between vocabulary items is a key
challenge in learning a new language. For example, the noun "wall" has
different lexical manifestations in Spanish -- "pared" refers to an indoor wall
while "muro" refers to an outside wall. However, this variety of lexical
distinction may not be obvious to non-native learners unless the distinction is
explained in such a way. In this work, we present a method for automatically
identifying fine-grained lexical distinctions, and extracting concise
descriptions explaining these distinctions in a human- and machine-readable
format. We confirm the quality of these extracted descriptions in a language
learning setup for two languages, Spanish and Greek, where we use them to teach
non-native speakers when to translate a given ambiguous word into its different
possible translations. Code and data are publicly released here
(https://github.com/Aditi138/LexSelection)
- Abstract(参考訳): 語彙項目のきめ細かい区別を学ぶことは、新しい言語を学ぶ上で重要な課題である。
例えば、名詞 "wall" はスペイン語で異なる語彙的表現を持ち、"pared" は屋内の壁、"mouro" は外側の壁を指す。
しかし、この種の語彙的区別は、その区別がそのような方法で説明されない限り、非ネイティブ学習者には明らかでないかもしれない。
本稿では,きめ細かな語彙の区別を自動的に識別する手法を提案し,これらの区別を説明する簡潔な記述を人間と機械で読みやすい形式で抽出する。
スペイン語とギリシャ語という2つの言語の言語学習環境において、これらの抽出された記述の品質を確認し、与えられた曖昧な単語を異なる可能な翻訳に翻訳するときに、非母語話者に教える。
コードとデータはここで公開されている(https://github.com/Aditi138/LexSelection)。
関連論文リスト
- Crowdsourcing Lexical Diversity [7.569845058082537]
本稿では,レキシコンのバイアス低減のための新しいクラウドソーシング手法を提案する。
群衆労働者は2つの言語からの語彙を比較し、親族や食べ物といった語彙の多様性に富む領域に焦点を当てる。
食品関連用語に焦点をあてた2つのケーススタディに適用し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-10-30T15:45:09Z) - What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Testing learning hypotheses using neural networks by manipulating learning data [20.525923251193472]
ニューラルネットワーク言語モデルでは、人間が表示するものと類似した受動的制約を学習できることが示される。
動詞が受動的に現れる頻度は受動性に大きな影響を及ぼすが、動詞の意味論は影響しない。
論文 参考訳(メタデータ) (2024-07-05T15:41:30Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [91.49622922938681]
本稿では,文法の異なる側面の記述を自動的に発見・可視化する自動フレームワークを提案する。
具体的には、形態素構文と意味論に関する疑問に答える自然なテキストコーパスから記述を抽出する。
この手法をインド語、カンナダ語、マラタイ語に応用するが、これは英語とは異なり、十分に発達した教育資源を持たない。
論文 参考訳(メタデータ) (2022-06-10T14:52:22Z) - UAlberta at SemEval 2022 Task 2: Leveraging Glosses and Translations for
Multilingual Idiomaticity Detection [4.66831886752751]
本稿では,SemEval-2022タスク2における多言語的慣用性検出のためのアルバータ大学システムについて述べる。
慣用的表現が非合成的という仮定の下では,表現の個々の単語の意味に関する情報を二項分類器に統合する。
2つ目の方法は文脈で表現を翻訳し、語彙知識ベースを用いて翻訳がリテラルであるかどうかを判定する。
論文 参考訳(メタデータ) (2022-05-27T16:35:00Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Exploring the Representation of Word Meanings in Context: A Case Study
on Homonymy and Synonymy [0.0]
我々は,静的モデルと文脈モデルの両方が,語彙-意味関係を適切に表現できる能力を評価する。
実験はガリシア語、ポルトガル語、英語、スペイン語で行われている。
論文 参考訳(メタデータ) (2021-06-25T10:54:23Z) - Probing Pretrained Language Models for Lexical Semantics [76.73599166020307]
類型的多様言語と5つの異なる語彙課題にまたがる系統的経験分析を行った。
我々の結果は、普遍的に維持されるパターンとベストプラクティスを示しているが、言語やタスクにまたがる顕著なバリエーションを示している。
論文 参考訳(メタデータ) (2020-10-12T14:24:01Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。