論文の概要: Dialectal Layers in West Iranian: a Hierarchical Dirichlet Process
Approach to Linguistic Relationships
- arxiv url: http://arxiv.org/abs/2001.05297v4
- Date: Thu, 17 Feb 2022 22:59:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 23:06:43.367420
- Title: Dialectal Layers in West Iranian: a Hierarchical Dirichlet Process
Approach to Linguistic Relationships
- Title(参考訳): 西イランの方言層--階層的ディリクレ過程の言語関係へのアプローチ
- Authors: Chundra Aroor Cathcart
- Abstract要約: 作業過程の過度に単純化された見解が、西イランの方言学に関する文献に広まっていると我々は主張する。
ペルシア語が唯一のドナー語ではないことが示されている。
多くの場合、西イラン語が異なる条件環境で異なる反射を示す可能性については、未調査のままである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper addresses a series of complex and unresolved issues in the
historical phonology of West Iranian languages. The West Iranian languages
(Persian, Kurdish, Balochi, and other languages) display a high degree of
non-Lautgesetzlich behavior. Most of this irregularity is undoubtedly due to
language contact; we argue, however, that an oversimplified view of the
processes at work has prevailed in the literature on West Iranian dialectology,
with specialists assuming that deviations from an expected outcome in a given
non-Persian language are due to lexical borrowing from some chronological stage
of Persian. It is demonstrated that this qualitative approach yields at times
problematic conclusions stemming from the lack of explicit probabilistic
inferences regarding the distribution of the data: Persian may not be the sole
donor language; additionally, borrowing at the lexical level is not always the
mechanism that introduces irregularity. In many cases, the possibility that
West Iranian languages show different reflexes in different conditioning
environments remains under-explored. We employ a novel Bayesian approach
designed to overcome these problems and tease apart the different determinants
of irregularity in patterns of West Iranian sound change. Our methodology
allows us to provisionally resolve a number of outstanding questions in the
literature on West Iranian dialectology concerning the dialectal affiliation of
certain sound changes. We outline future directions for work of this sort.
- Abstract(参考訳): 本稿は、西イラン語の歴史音韻学における、複雑で未解決の一連の問題に対処する。
西イランの言語(ペルシア語、クルド語、バラチ語、その他の言語)は、非ラウトゲシュリッヒ的な振る舞いの度合いが高い。
しかし、西イラン方言学の文献では、作業プロセスに対する過度に単純化された見解が普及しており、専門家は、特定の非ペルシア語における期待される結果からの逸脱は、ペルシア語の年代学的段階からの語彙的借用によるものであると仮定している。
この定性的なアプローチは、データの分布に関する明示的な確率論的推論の欠如から生じる問題的な結論をもたらすことが示されている: ペルシア語は唯一のドナー言語ではないかもしれない; さらに、語彙レベルで借りることが必ずしも不規則性をもたらすメカニズムであるとは限らない。
多くの場合、西イランの言語が異なる条件条件下で異なる反射を示す可能性は未検討のままである。
我々は、これらの問題を克服し、西イランの音響変化のパターンにおける不規則性の異なる決定要因を分解するために設計された新しいベイズ的アプローチを採用する。
提案手法により,西イラン語方言学における特定の音変化の弁証的関連に関する多くの顕著な疑問を予備的に解決することができる。
この種の作業の今後の方向性について概説する。
関連論文リスト
- On the Proper Treatment of Tokenization in Psycholinguistics [53.960910019072436]
論文は、トークンレベルの言語モデルは、精神言語学研究で使用される前に、文字レベルの言語モデルにマージ化されるべきであると主張している。
興味領域自体のサブプライムよりも心理学的予測が優れている様々な焦点領域を見いだす。
論文 参考訳(メタデータ) (2024-10-03T17:18:03Z) - Disentangling Dialect from Social Bias via Multitask Learning to Improve Fairness [16.746758715820324]
本稿では,構文的および語彙的バリエーションを組み込む補助課題として,方言をモデル化するマルチタスク学習手法を提案する。
アフリカ系アメリカ人の英語方言を用いた実験では、共通学習アプローチと方言モデリングを補完することで、その公正さが向上することを示す実証的証拠を提供する。
その結果、マルチタスク学習は最先端の性能を達成し、偏りのある言語の性質をより確実に検出するのに役立つことが示唆された。
論文 参考訳(メタデータ) (2024-06-14T12:39:39Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Task-Agnostic Low-Rank Adapters for Unseen English Dialects [52.88554155235167]
LLM(Large Language Models)は、標準アメリカ英語を好んで不均等に重み付けされたコーパスで訓練される。
HyperLoRAは、方言特化情報と方言横断情報を混同することにより、タスクに依存しない方法で未確認の方言への一般化を改善する。
論文 参考訳(メタデータ) (2023-11-02T01:17:29Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Developing an Informal-Formal Persian Corpus [0.0]
単語/フレーズレベルのアライメントを持つ5万文ペアの並列コーパスを構築する。
結果として得られたコーパスは約530,000のアライメントを持ち、辞書には49,397の単語対とフレーズ対が含まれている。
論文 参考訳(メタデータ) (2023-08-10T04:57:34Z) - Curras + Baladi: Towards a Levantine Corpus [0.0]
約9.6Kの注釈付きトークンからなるレバノン・コーパス・バラディを提示する。
提案するコーパスは,キュラスを濃縮し,より一般的なレバンタインコーパスに変換するために構築された。
論文 参考訳(メタデータ) (2022-05-19T16:53:04Z) - Can Linguistic Distance help Language Classification? Assessing
Hawrami-Zaza and Kurmanji-Sorani [0.0]
ハフラミ語とザザ語は、イラン語の研究に活発な言語学者の間で、しばらくの間議論され、議論されてきた。
これらの言語/方言がクルド語に属するのか、それともイラン語の子孫であるのかという問題は、マッケンジー(1961年)によって答えられた。
方言を話す人々の大多数は、その答えに反対している。彼らの不承認は主に、方言の話者間の社会学的、文化的、歴史的関係に基づいているようだ。
論文 参考訳(メタデータ) (2021-10-27T12:52:19Z) - On Negative Interference in Multilingual Models: Findings and A
Meta-Learning Treatment [59.995385574274785]
従来の信念に反して、負の干渉は低リソース言語にも影響を及ぼすことを示す。
メタ学習アルゴリズムは、より優れた言語間変換性を得、負の干渉を軽減する。
論文 参考訳(メタデータ) (2020-10-06T20:48:58Z) - A novel approach to sentiment analysis in Persian using discourse and
external semantic information [0.0]
自然言語で書かれた文書から個人の感情を抽出するための多くのアプローチが提案されている。
これらのアプローチの大半は英語に重点を置いているが、ペルシア語のような資源中心の言語は研究作業や言語資源の欠如に悩まされている。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい手法を導入することを目的としている。
論文 参考訳(メタデータ) (2020-07-18T18:40:40Z) - A Call for More Rigor in Unsupervised Cross-lingual Learning [76.6545568416577]
このような研究の既存の理論的根拠は、世界の多くの言語における並列データの欠如に基づいている。
並列データと豊富なモノリンガルデータのないシナリオは現実的には非現実的であると我々は主張する。
論文 参考訳(メタデータ) (2020-04-30T17:06:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。