論文の概要: A Stochastic Analysis of the Linguistic Provenance of English Place
Names
- arxiv url: http://arxiv.org/abs/2312.12850v3
- Date: Tue, 2 Jan 2024 10:01:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 19:15:12.368564
- Title: A Stochastic Analysis of the Linguistic Provenance of English Place
Names
- Title(参考訳): 英語地名の言語的特徴に関する確率論的分析
- Authors: Michael Dalvean
- Abstract要約: H' は英語の最も古風な地名であり、Anna' は最小である。
非英語のデータセットの地名はノルウェーの地名に最もよく似ており、ウェールズの地名に最も近い。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In English place name analysis, meanings are often derived from the
resemblance of roots in place names to topographical features, proper names
and/or habitation terms in one of the languages that have had an influence on
English place names. The problem here is that it is sometimes difficult to
determine the base language to use to interpret the roots. The purpose of this
paper is to stochastically determine the resemblance between 18799 English
place names and 84687 place names from Ireland, Scotland, Wales, Denmark,
Norway, Sweden, France, Germany, the Netherlands and Ancient Rome. Each English
place name is ranked according to the extent to which it resembles place names
from the other countries, and this provides a basis for determining the likely
language to use to interpret the place name. A number of observations can be
made using the ranking provided. In particular, it is found that `Harlington'
is the most archetypically English place name in the English sample, and `Anna'
is the least. Furthermore, it is found that the place names in the non-English
datasets are most similar to Norwegian place names and least similar to Welsh
place names.
- Abstract(参考訳): 英語の地名分析では、英語の地名に影響を与えた言語の1つで、地名のルートと地形的特徴、固有名および/または居住用語との類似から意味が導かれることが多い。
ここでの問題は、根の解釈に使用するベース言語を決定するのが難しい場合があります。
本論文の目的は、アイルランド、スコットランド、ウェールズ、デンマーク、ノルウェー、スウェーデン、フランス、ドイツ、オランダ、古代ローマの18799の地名と84687の地名の類似性を統計的に決定することである。
各英語の地名は、他国の地名に類似している程度に応じてランク付けされ、地名を解釈するために使用する可能性のある言語を決定する基礎となる。
提供されるランキングを使って、多くの観察を行うことができる。
特に、"Harlington" は英語のサンプルの中では最も古風な英語の地名であり、"Anna" は最小である。
さらに、非英語の地名はノルウェー語地名に最もよく似ており、ウェールズ語地名に最も似ていることが判明した。
関連論文リスト
- Identifying Planetary Names in Astronomy Papers: A Multi-Step Approach [0.0]
多くの特徴名はシリア、アインシュタイン、セーガンなどの名前にちなむ地名や人物の名前と重複している。
いくつかの特徴名は、月のクレーターであるブラック、グリーン、ホワイトなど、形容詞である。
いくつかの特徴名は、月の西と南のクレーターのような方向を向いている。
論文 参考訳(メタデータ) (2023-12-14T00:50:14Z) - The Impact of Familiarity on Naming Variation: A Study on Object Naming
in Mandarin Chinese [4.6112416098164255]
中国語の言語とビジョンのデータセットを作成し、1319の自然主義的な画像に平均20の名前を付ける。
本研究では,対象物に対する親しみ度が,対象物間で引き起こされる命名変化の程度にどの程度関係しているかを検討する。
論文 参考訳(メタデータ) (2023-11-16T20:13:24Z) - Cross-Dialect Sentence Transformation: A Comparative Analysis of
Language Models for Adapting Sentences to British English [0.0]
本研究は、アメリカ、インド、アイルランドの英語方言の言語的区別について考察する。
様々な言語モデル(LLM)を評価し、これらの方言から英国英語の翻訳を生成する。
論文 参考訳(メタデータ) (2023-11-05T12:56:28Z) - HeGeL: A Novel Dataset for Geo-Location from Hebrew Text [5.109028790494419]
本稿では,Hebrew Geo-Location (HeGeL) コーパスについて述べる。
我々はイスラエルの3都市で5,649件のヘブライ語地名をクラウドソーシングした。
論文 参考訳(メタデータ) (2023-07-02T08:09:10Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Helpful Neighbors: Leveraging Neighbors in Geographic Feature
Pronunciation [69.34388661539877]
本稿では,特定の特徴の発音を推測するために,隣接する名前の発音を学習する新しいアーキテクチャを提案する。
日本語の地名に応用して,Googleマップにおける誤り訂正の検索と提案のためのモデルの有用性を実証する。
我々はまた、全く異なるタスクに対する適用について報告する: 比較歴史言語学におけるコグネート反射予測。
論文 参考訳(メタデータ) (2022-10-18T22:55:16Z) - Quantifying Gender Bias Towards Politicians in Cross-Lingual Language
Models [104.41668491794974]
代名詞として政治家の名前を取り巻く言語モデルによって生成される形容詞と動詞の用法を定量化する。
死者や指定された言葉が男女の政治家と関連しているのに対し、美人や離婚といった特定の言葉が主に女性政治家に関係していることが判明した。
論文 参考訳(メタデータ) (2021-04-15T15:03:26Z) - How to Probe Sentence Embeddings in Low-Resource Languages: On
Structural Design Choices for Probing Task Evaluation [82.96358326053115]
構造設計選択に対する探索作業結果の感度について検討する。
我々は、英語で識別する「安定な領域」にある設計選択を多言語で構成した埋め込みを探索する。
私たちは英語の結果が他の言語に移行しないことに気付きます。
論文 参考訳(メタデータ) (2020-06-16T12:37:50Z) - Design Challenges in Low-resource Cross-lingual Entity Linking [56.18957576362098]
言語間エンティティリンク (XEL) は、外国語テキスト中のエンティティの言及をウィキペディアのような英語の知識ベースに根拠付ける問題である。
本稿は、英語のウィキペディアの候補タイトルを、特定の外国語の言及に対応付けて識別する重要なステップに焦点を当てる。
本稿では,検索エンジンのクエリログを利用した簡易で効果的なゼロショットXELシステムQuELを提案する。
論文 参考訳(メタデータ) (2020-05-02T04:00:26Z) - Predicting Declension Class from Form and Meaning [70.65971611552871]
クラスメンバーシップは決定論的には程遠いが、名詞と/またはその意味の音韻学的形式は、しばしば不完全な手がかりを与える。
我々は、どの程度の情報、ビットで、名詞の形式や意味を知ることの難しさを測ることによって、これを運用する。
2つのインド・ヨーロッパ語(チェコ語とドイツ語)がそれぞれ、大量の情報をクラスと共有していることがわかった。
論文 参考訳(メタデータ) (2020-05-01T21:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。