論文の概要: A Stochastic Analysis of the Linguistic Provenance of English Place
Names
- arxiv url: http://arxiv.org/abs/2312.12850v3
- Date: Tue, 2 Jan 2024 10:01:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 19:15:12.368564
- Title: A Stochastic Analysis of the Linguistic Provenance of English Place
Names
- Title(参考訳): 英語地名の言語的特徴に関する確率論的分析
- Authors: Michael Dalvean
- Abstract要約: H' は英語の最も古風な地名であり、Anna' は最小である。
非英語のデータセットの地名はノルウェーの地名に最もよく似ており、ウェールズの地名に最も近い。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In English place name analysis, meanings are often derived from the
resemblance of roots in place names to topographical features, proper names
and/or habitation terms in one of the languages that have had an influence on
English place names. The problem here is that it is sometimes difficult to
determine the base language to use to interpret the roots. The purpose of this
paper is to stochastically determine the resemblance between 18799 English
place names and 84687 place names from Ireland, Scotland, Wales, Denmark,
Norway, Sweden, France, Germany, the Netherlands and Ancient Rome. Each English
place name is ranked according to the extent to which it resembles place names
from the other countries, and this provides a basis for determining the likely
language to use to interpret the place name. A number of observations can be
made using the ranking provided. In particular, it is found that `Harlington'
is the most archetypically English place name in the English sample, and `Anna'
is the least. Furthermore, it is found that the place names in the non-English
datasets are most similar to Norwegian place names and least similar to Welsh
place names.
- Abstract(参考訳): 英語の地名分析では、英語の地名に影響を与えた言語の1つで、地名のルートと地形的特徴、固有名および/または居住用語との類似から意味が導かれることが多い。
ここでの問題は、根の解釈に使用するベース言語を決定するのが難しい場合があります。
本論文の目的は、アイルランド、スコットランド、ウェールズ、デンマーク、ノルウェー、スウェーデン、フランス、ドイツ、オランダ、古代ローマの18799の地名と84687の地名の類似性を統計的に決定することである。
各英語の地名は、他国の地名に類似している程度に応じてランク付けされ、地名を解釈するために使用する可能性のある言語を決定する基礎となる。
提供されるランキングを使って、多くの観察を行うことができる。
特に、"Harlington" は英語のサンプルの中では最も古風な英語の地名であり、"Anna" は最小である。
さらに、非英語の地名はノルウェー語地名に最もよく似ており、ウェールズ語地名に最も似ていることが判明した。
関連論文リスト
- Dictionary Insertion Prompting for Multilingual Reasoning on Multilingual Large Language Models [52.00446751692225]
textbfDictionary textbfInsertion textbfPrompting (textbfDIP) という,新規かつシンプルで効果的な方法を提案する。
非英語のプロンプトを提供する際、DIPは単語辞書を調べ、単語の英語のプロンプトをLLMのプロンプトに挿入する。
そして、英語へのより良い翻訳とより良い英語モデル思考のステップを可能にし、明らかにより良い結果をもたらす。
論文 参考訳(メタデータ) (2024-11-02T05:10:50Z) - Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。
我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文 参考訳(メタデータ) (2024-10-05T20:40:49Z) - Killing Two Flies with One Stone: An Attempt to Break LLMs Using English->Icelandic Idioms and Proper Names [0.7499722271664147]
本稿は,英語・アイスランド語翻訳における慣用的表現と固有名称について述べる。
まず、一般的な英語の慣用表現の翻訳におけるMTシステムの能力を評価する。
2つ目のテストスイートはアイスランドの地名に翻訳され、正しく入力される場所名で構成されている。
論文 参考訳(メタデータ) (2024-10-04T12:57:00Z) - What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Mapping the Past: Geographically Linking an Early 20th Century Swedish Encyclopedia with Wikidata [0.0]
私たちは、38巻と182,000以上の記事からなる『textitUggleupplagan』という第2版に焦点を当てた。
項目の約22%が場所であることがわかった。
この論文は、ファミルイェボクのテクストにおける地理的情報の選択と表現に光を当て、歴史的・社会的視点に関する洞察を与えている。
論文 参考訳(メタデータ) (2024-06-25T19:34:00Z) - Sampling the Swadesh List to Identify Similar Languages with Tree Spaces [0.0]
英語とラテンアルファベットの祖先は主要な関心事である。
インド・ヨーロッパ・ツリーは、多くの近代言語を原インド・ヨーロッパ語源に遡る。
論文 参考訳(メタデータ) (2024-05-10T15:46:05Z) - The Impact of Familiarity on Naming Variation: A Study on Object Naming
in Mandarin Chinese [4.6112416098164255]
中国語の言語とビジョンのデータセットを作成し、1319の自然主義的な画像に平均20の名前を付ける。
本研究では,対象物に対する親しみ度が,対象物間で引き起こされる命名変化の程度にどの程度関係しているかを検討する。
論文 参考訳(メタデータ) (2023-11-16T20:13:24Z) - Helpful Neighbors: Leveraging Neighbors in Geographic Feature
Pronunciation [69.34388661539877]
本稿では,特定の特徴の発音を推測するために,隣接する名前の発音を学習する新しいアーキテクチャを提案する。
日本語の地名に応用して,Googleマップにおける誤り訂正の検索と提案のためのモデルの有用性を実証する。
我々はまた、全く異なるタスクに対する適用について報告する: 比較歴史言語学におけるコグネート反射予測。
論文 参考訳(メタデータ) (2022-10-18T22:55:16Z) - Design Challenges in Low-resource Cross-lingual Entity Linking [56.18957576362098]
言語間エンティティリンク (XEL) は、外国語テキスト中のエンティティの言及をウィキペディアのような英語の知識ベースに根拠付ける問題である。
本稿は、英語のウィキペディアの候補タイトルを、特定の外国語の言及に対応付けて識別する重要なステップに焦点を当てる。
本稿では,検索エンジンのクエリログを利用した簡易で効果的なゼロショットXELシステムQuELを提案する。
論文 参考訳(メタデータ) (2020-05-02T04:00:26Z) - Predicting Declension Class from Form and Meaning [70.65971611552871]
クラスメンバーシップは決定論的には程遠いが、名詞と/またはその意味の音韻学的形式は、しばしば不完全な手がかりを与える。
我々は、どの程度の情報、ビットで、名詞の形式や意味を知ることの難しさを測ることによって、これを運用する。
2つのインド・ヨーロッパ語(チェコ語とドイツ語)がそれぞれ、大量の情報をクラスと共有していることがわかった。
論文 参考訳(メタデータ) (2020-05-01T21:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。