Fugu-MT 論文翻訳(概要): Can Linguistic Distance help Language Classification? Assessing Hawrami-Zaza and Kurmanji-Sorani

論文の概要: Can Linguistic Distance help Language Classification? Assessing Hawrami-Zaza and Kurmanji-Sorani

arxiv url: http://arxiv.org/abs/2110.14398v1
Date: Wed, 27 Oct 2021 12:52:19 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-28 21:31:52.539248
Title: Can Linguistic Distance help Language Classification? Assessing Hawrami-Zaza and Kurmanji-Sorani
Title（参考訳）: 言語距離は言語分類に役立つか? ハフラミザザとクルマンジソラーニの鑑定
Authors: Hossein Hassani
Abstract要約: ハフラミ語とザザ語は、イラン語の研究に活発な言語学者の間で、しばらくの間議論され、議論されてきた。これらの言語/方言がクルド語に属するのか、それともイラン語の子孫であるのかという問題は、マッケンジー(1961年)によって答えられた。方言を話す人々の大多数は、その答えに反対している。彼らの不承認は主に、方言の話者間の社会学的、文化的、歴史的関係に基づいているようだ。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: To consider Hawrami and Zaza (Zazaki) standalone languages or dialects of a language have been discussed and debated for a while among linguists active in studying Iranian languages. The question of whether those languages/dialects belong to the Kurdish language or if they are independent descendants of Iranian languages was answered by MacKenzie (1961). However, a majority of people who speak the dialects are against that answer. Their disapproval mainly seems to be based on the sociological, cultural, and historical relationship among the speakers of the dialects. While the case of Hawrami and Zaza has remained unexplored and under-examined, an almost unanimous agreement exists about the classification of Kurmanji and Sorani as Kurdish dialects. The related studies to address the mentioned cases are primarily qualitative. However, computational linguistics could approach the question from a quantitative perspective. In this research, we look into three questions from a linguistic distance point of view. First, how similar or dissimilar Hawrami and Zaza are, considering no common geographical coexistence between the two. Second, what about Kurmanji and Sorani that have geographical overlap. Finally, what is the distance among all these dialects, pair by pair? We base our computation on phonetic presentations of these dialects (languages), and we calculate various linguistic distances among the pairs. We analyze the data and discuss the results to conclude.
Abstract（参考訳）: ヘラミ語とザザ語(ザザキ語)は、イラン語の研究に活発な言語学者の間で、しばらくの間議論され議論されてきた。これらの言語/方言がクルド語に属するのか、イラン語の子孫なのかという疑問はマッケンジー (1961) によって答えられた。しかし、方言を話す人の大多数はその答えに反対している。彼らの不承認は主に方言話者間の社会学的、文化的、歴史的関係に基づいているようである。ハフラミ語とザザ語は未調査で未検討のままであるが、クルマンジ語とソラニ語をクルド語の方言として分類することに関してほぼ一致している。上記の事例に対処する関連する研究は主に質的である。しかし、計算言語学は定量的観点からその問題にアプローチすることができる。本研究では,言語的距離の観点から3つの疑問を考察する。まず、hawramiとzazaの類似点や相違点について、両者の地理的共存を考慮に入れる。次に、地理的に重複するクルマンジとソラニについてはどうか。最後に、これらの方言間の距離は、ペア対ですか? 我々は,これらの方言(言語)の音声表現に基づく計算を行い,ペア間の言語距離を算出した。データを分析して結果について議論する。

関連論文リスト

Large Language Models Discriminate Against Speakers of German Dialects [44.05620251584259]
ドイツでは、人口の40%以上が地域方言を話している。このようなステレオタイプが大規模言語モデル(LLM)によってミラーされているかを検討する。言語的人口統計学(ドイツ語方言話者)の明示的なラベル付けは、方言使用法のような暗黙の手がかり以上のバイアスを増幅する。
論文参考訳（メタデータ） (2025-09-17T09:05:37Z)
Revisiting Common Assumptions about Arabic Dialects in NLP [15.46274799809334]
NLP文学では、アラビア方言に関するいくつかの仮定が広く採用されている。これらの仮定は、アラビア方言識別(ADI)のような異なる計算タスクで表される。これら4つの仮定を同定し、マルチラベルデータセットを拡張して解析する。我々の分析は、4つの仮定が現実を単純化し過ぎていることを示している。
論文参考訳（メタデータ） (2025-05-27T22:56:33Z)
Exploring Diachronic and Diatopic Changes in Dialect Continua: Tasks, Datasets and Challenges [2.572144535177391]
我々は3つの言語族(スラヴ語、ロマンス語、ゲルマン語)から5つの方言にまたがる9つのタスクとデータセットを批判的に評価する。本稿では,方言使用の経時的変化,方言データセットの信頼性,話者特性の重要性,方言の限られた範囲,データ収集における倫理的配慮に関する5つのオープンな課題を概説する。言語の種類や方言の包括的計算手法やデータセットに関する今後の研究に光を当てることを願っています。
論文参考訳（メタデータ） (2024-07-04T15:38:38Z)
Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文参考訳（メタデータ） (2024-06-27T22:38:04Z)
CaLMQA: Exploring culturally specific long-form question answering across 23 languages [58.18984409715615]
CaLMQAは、23の言語にまたがる1.5Kの文化的に特定の質問のコレクションであり、51の文化的に翻訳された質問は、英語から22の言語に翻訳されている。コミュニティのWebフォーラムから自然に発生する質問を収集し、ネイティブスピーカーを雇い、FijianやKirndiといった未調査言語をカバーする質問を書いています。私たちのデータセットには、文化的トピック(伝統、法律、ニュースなど)とネイティブスピーカーの言語使用を反映した、多種多様な複雑な質問が含まれています。
論文参考訳（メタデータ） (2024-06-25T17:45:26Z)
What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文参考訳（メタデータ） (2024-02-19T09:15:28Z)
Task-Agnostic Low-Rank Adapters for Unseen English Dialects [52.88554155235167]
LLM(Large Language Models)は、標準アメリカ英語を好んで不均等に重み付けされたコーパスで訓練される。 HyperLoRAは、方言特化情報と方言横断情報を混同することにより、タスクに依存しない方法で未確認の方言への一般化を改善する。
論文参考訳（メタデータ） (2023-11-02T01:17:29Z)
Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文参考訳（メタデータ） (2023-10-23T17:42:01Z)
Still no evidence for an effect of the proportion of non-native speakers on language complexity -- A response to Kauhanen, Einhaus & Walkden (2023) [91.3755431537592]
Kauhanen, Einhaus & Walkden氏は、私の論文の1つで示された結果を批判している。どちらの批判点も明確に述べられ、私の論文で分析されていることを示します。
論文参考訳（メタデータ） (2023-04-29T09:58:32Z)
Comparing Spoken Languages using Paninian System of Sounds and Finite State Machines [0.0]
我々はサンスクリットを中心とする言語開発のための生態系モデルを提案する。言語間の単語を音声マップ上の状態遷移として表現し,それに対応する形態的有限オートマタを構築する。
論文参考訳（メタデータ） (2023-01-29T15:22:10Z)
Curras + Baladi: Towards a Levantine Corpus [0.0]
約9.6Kの注釈付きトークンからなるレバノン・コーパス・バラディを提示する。提案するコーパスは,キュラスを濃縮し,より一般的なレバンタインコーパスに変換するために構築された。
論文参考訳（メタデータ） (2022-05-19T16:53:04Z)
\`It\`ak\'ur\`oso: Exploiting Cross-Lingual Transferability for Natural Language Generation of Dialogues in Low-Resource, African Languages [0.9511471519043974]
本研究では,最先端のモノリンガルモデル(SoTA)から6つのアフリカ語への言語間移動の可能性について検討する。言語はスワヒリ語、ヴロフ語、ハウサ語、ナイジェリア語、ピジン語、キンヤルワンダ語、ヨルバ語である。結果は、深い単言語モデルが言語にまたがって一般化する抽象性を学ぶという仮説が成り立つことを示している。
論文参考訳（メタデータ） (2022-04-17T20:23:04Z)
Similarities between Arabic Dialects: Investigating Geographical Proximity [0.0]
本稿では,アラブ諸国に位置する都市の地理的近接が方言的類似性に及ぼす影響について考察する。以上の結果から,異なる国に位置する都市は,地理的近接度によって,同一国の都市よりも方言的類似性が高いことが示唆された。
論文参考訳（メタデータ） (2021-05-10T09:32:21Z)
Dialectal Layers in West Iranian: a Hierarchical Dirichlet Process Approach to Linguistic Relationships [0.0]
作業過程の過度に単純化された見解が、西イランの方言学に関する文献に広まっていると我々は主張する。ペルシア語が唯一のドナー語ではないことが示されている。多くの場合、西イラン語が異なる条件環境で異なる反射を示す可能性については、未調査のままである。
論文参考訳（メタデータ） (2020-01-13T11:23:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。