論文の概要: When is Wall a Pared and when a Muro? -- Extracting Rules Governing
Lexical Selection
- arxiv url: http://arxiv.org/abs/2109.06014v1
- Date: Mon, 13 Sep 2021 14:49:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:44:02.490321
- Title: When is Wall a Pared and when a Muro? -- Extracting Rules Governing
Lexical Selection
- Title(参考訳): 壁はいつ、室はいつ?
--語彙選択を規定する規則の抽出
- Authors: Aditi Chaudhary, Kayo Yin, Antonios Anastasopoulos, Graham Neubig
- Abstract要約: 本稿では,微細な語彙の区別を自動的に識別する手法を提案する。
我々は、これらの区別を説明する簡潔な記述を、人間と機械で読める形式で抽出する。
我々はこれらの記述を用いて、与えられた曖昧な単語を異なる可能な翻訳に翻訳する時、非ネイティブ話者に教える。
- 参考スコア(独自算出の注目度): 85.0262994506624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning fine-grained distinctions between vocabulary items is a key
challenge in learning a new language. For example, the noun "wall" has
different lexical manifestations in Spanish -- "pared" refers to an indoor wall
while "muro" refers to an outside wall. However, this variety of lexical
distinction may not be obvious to non-native learners unless the distinction is
explained in such a way. In this work, we present a method for automatically
identifying fine-grained lexical distinctions, and extracting concise
descriptions explaining these distinctions in a human- and machine-readable
format. We confirm the quality of these extracted descriptions in a language
learning setup for two languages, Spanish and Greek, where we use them to teach
non-native speakers when to translate a given ambiguous word into its different
possible translations. Code and data are publicly released here
(https://github.com/Aditi138/LexSelection)
- Abstract(参考訳): 語彙項目のきめ細かい区別を学ぶことは、新しい言語を学ぶ上で重要な課題である。
例えば、名詞 "wall" はスペイン語で異なる語彙的表現を持ち、"pared" は屋内の壁、"mouro" は外側の壁を指す。
しかし、この種の語彙的区別は、その区別がそのような方法で説明されない限り、非ネイティブ学習者には明らかでないかもしれない。
本稿では,きめ細かな語彙の区別を自動的に識別する手法を提案し,これらの区別を説明する簡潔な記述を人間と機械で読みやすい形式で抽出する。
スペイン語とギリシャ語という2つの言語の言語学習環境において、これらの抽出された記述の品質を確認し、与えられた曖昧な単語を異なる可能な翻訳に翻訳するときに、非母語話者に教える。
コードとデータはここで公開されている(https://github.com/Aditi138/LexSelection)。
関連論文リスト
- Computational valency lexica and Homeric formularity [1.6346069386394704]
我々は、古代ギリシアの依存木バンクから自動的に抽出された古代ギリシアの辞書 AGVaLex を提示する。
それは、動詞とその議論に関する量的コーパス駆動型形態学、構文的、語彙的情報を含んでいる。
古代ギリシアの著者の言語研究に広く応用されている。
論文 参考訳(メタデータ) (2022-08-23T08:03:16Z) - Zero-shot Cross-Linguistic Learning of Event Semantics [27.997873309702225]
アラビア語、中国語、ファルシ語、ドイツ語、ロシア語、トルコ語にまたがる画像のキャプションを見る。
我々は,この言語について注釈付きデータを全く見ていないにもかかわらず,ある言語に対して語彙的側面が予測可能であることを示す。
論文 参考訳(メタデータ) (2022-07-05T23:18:36Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [91.49622922938681]
本稿では,文法の異なる側面の記述を自動的に発見・可視化する自動フレームワークを提案する。
具体的には、形態素構文と意味論に関する疑問に答える自然なテキストコーパスから記述を抽出する。
この手法をインド語、カンナダ語、マラタイ語に応用するが、これは英語とは異なり、十分に発達した教育資源を持たない。
論文 参考訳(メタデータ) (2022-06-10T14:52:22Z) - UAlberta at SemEval 2022 Task 2: Leveraging Glosses and Translations for
Multilingual Idiomaticity Detection [4.66831886752751]
本稿では,SemEval-2022タスク2における多言語的慣用性検出のためのアルバータ大学システムについて述べる。
慣用的表現が非合成的という仮定の下では,表現の個々の単語の意味に関する情報を二項分類器に統合する。
2つ目の方法は文脈で表現を翻訳し、語彙知識ベースを用いて翻訳がリテラルであるかどうかを判定する。
論文 参考訳(メタデータ) (2022-05-27T16:35:00Z) - AUTOLEX: An Automatic Framework for Linguistic Exploration [93.89709486642666]
本稿では言語学者による言語現象の簡潔な記述の発見と抽出を容易にするための自動フレームワークを提案する。
具体的には、この枠組みを用いて、形態的一致、ケースマーキング、単語順序の3つの現象について記述を抽出する。
本研究では,言語専門家の助けを借りて記述を評価し,人間の評価が不可能な場合に自動評価を行う手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T20:37:30Z) - Exploring the Representation of Word Meanings in Context: A Case Study
on Homonymy and Synonymy [0.0]
我々は,静的モデルと文脈モデルの両方が,語彙-意味関係を適切に表現できる能力を評価する。
実験はガリシア語、ポルトガル語、英語、スペイン語で行われている。
論文 参考訳(メタデータ) (2021-06-25T10:54:23Z) - Probing Pretrained Language Models for Lexical Semantics [76.73599166020307]
類型的多様言語と5つの異なる語彙課題にまたがる系統的経験分析を行った。
我々の結果は、普遍的に維持されるパターンとベストプラクティスを示しているが、言語やタスクにまたがる顕著なバリエーションを示している。
論文 参考訳(メタデータ) (2020-10-12T14:24:01Z) - Speakers Fill Lexical Semantic Gaps with Context [69.30534067031734]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Predicting Declension Class from Form and Meaning [70.65971611552871]
クラスメンバーシップは決定論的には程遠いが、名詞と/またはその意味の音韻学的形式は、しばしば不完全な手がかりを与える。
我々は、どの程度の情報、ビットで、名詞の形式や意味を知ることの難しさを測ることによって、これを運用する。
2つのインド・ヨーロッパ語(チェコ語とドイツ語)がそれぞれ、大量の情報をクラスと共有していることがわかった。
論文 参考訳(メタデータ) (2020-05-01T21:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。