論文の概要: Stability of Syntactic Dialect Classification Over Space and Time
- arxiv url: http://arxiv.org/abs/2209.04958v1
- Date: Sun, 11 Sep 2022 23:14:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 13:02:39.350293
- Title: Stability of Syntactic Dialect Classification Over Space and Time
- Title(参考訳): 空間と時間における統語辞書分類の安定性
- Authors: Jonathan Dunn and Sidney Wong
- Abstract要約: 本稿では,12の方言を対象に,月々の間隔で3年間にまたがる英語の12の方言を対象に,1120都市にまたがる空間分布を定式化するテストセットを構築した。
各方言の分類性能の劣化率は時間とともに減少し,統語的変化を受ける地域を特定することができる。
また、方言領域における分類精度の分布により、方言の文法が内部的に不均一である程度を特定できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper analyses the degree to which dialect classifiers based on
syntactic representations remain stable over space and time. While previous
work has shown that the combination of grammar induction and geospatial text
classification produces robust dialect models, we do not know what influence
both changing grammars and changing populations have on dialect models. This
paper constructs a test set for 12 dialects of English that spans three years
at monthly intervals with a fixed spatial distribution across 1,120 cities.
Syntactic representations are formulated within the usage-based Construction
Grammar paradigm (CxG). The decay rate of classification performance for each
dialect over time allows us to identify regions undergoing syntactic change.
And the distribution of classification accuracy within dialect regions allows
us to identify the degree to which the grammar of a dialect is internally
heterogeneous. The main contribution of this paper is to show that a rigorous
evaluation of dialect classification models can be used to find both variation
over space and change over time.
- Abstract(参考訳): 本稿では,構文表現に基づく方言分類器が空間的・時間的に安定である程度を解析する。
従来の研究では、文法誘導と地理空間テキスト分類の組み合わせが堅牢な方言モデルを生み出すことが示されているが、文法の変化と人口の変化が方言モデルに与える影響は分かっていない。
本稿では,1,120都市に一定の空間分布を持つ月々3年間にわたる12の英語方言を対象としたテストセットを構築した。
構文表現は、uses-based construction grammar paradigm (cxg)で定式化されている。
各方言の分類性能は時間とともに低下するので,構文変化中の領域を識別できる。
また、方言領域における分類精度の分布により、方言の文法が内部的に不均一である程度を特定できる。
本研究の主な貢献は,方言分類モデルの厳密な評価により,空間的変化と時間的変化の両方を見出すことができることを示すことである。
関連論文リスト
- Dialetto, ma Quanto Dialetto? Transcribing and Evaluating Dialects on a Continuum [25.732397636695882]
イタリア語方言における音声とテキストのパフォーマンスを測定し,地理的な特徴の相違を実証的に観察する。
この格差は(-0.5)言語的に最もパフォーマンスの高い方言とほぼ類似している。
さらに, 地学的手法を用いて, 見えない場所でのゼロショット性能を予測し, 地理的情報の導入により予測性能を大幅に向上する。
論文 参考訳(メタデータ) (2024-10-18T16:39:42Z) - Modeling Orthographic Variation in Occitan's Dialects [3.038642416291856]
大規模多言語モデルは、前処理時のスペル正規化の必要性を最小限に抑える。
以上の結果から,複数言語モデルでは,前処理時のスペル正規化の必要性が最小限に抑えられていることが示唆された。
論文 参考訳(メタデータ) (2024-04-30T07:33:51Z) - Explainability of machine learning approaches in forensic linguistics: a case study in geolinguistic authorship profiling [46.58131072375399]
法医学的文脈を考慮した機械学習手法の説明可能性について検討する。
我々は、ドイツ語圏のソーシャルメディアデータに基づく未知のテキストのジオ言語的プロファイリングの手段として、多種多様な分類に焦点を当てた。
抽出した語彙的特徴がそれぞれの品種を実際に代表しており、訓練されたモデルは分類の場所名にも依存していることに注意する。
論文 参考訳(メタデータ) (2024-04-29T08:52:52Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Syntactic Variation Across the Grammar: Modelling a Complex Adaptive
System [0.76146285961466]
16か国49の英語話者の方言変化をモデル化した。
その結果,構文変化の重要な部分は文法の異なる部分間の相互作用から成り立っていることがわかった。
ニュージーランド英語は、オーストラリア英語の phrasal verb に類似しているが、同時に英英語の dative phrase にも類似している。
論文 参考訳(メタデータ) (2023-09-21T08:14:34Z) - DADA: Dialect Adaptation via Dynamic Aggregation of Linguistic Rules [64.93179829965072]
DADAは、多言語対応のSAE訓練モデルに対するモジュラーアプローチである。
DADAは単一タスクと命令言語モデルの両方に有効であることを示す。
論文 参考訳(メタデータ) (2023-05-22T18:43:31Z) - Variation and Instability in Dialect-Based Embedding Spaces [0.0]
本論文は、英語の異なる地域品種で訓練された埋め込み空間の変動を測定する。
実験により、埋め込み空間はトレーニングデータに表される方言に大きく影響されることが確認された。
論文 参考訳(メタデータ) (2023-03-27T07:53:23Z) - CCPrefix: Counterfactual Contrastive Prefix-Tuning for Many-Class
Classification [57.62886091828512]
多クラス分類のための新しいプレフィックスチューニング手法であるCCPrefixを提案する。
基本的に、ラベル空間における実数対から派生したインスタンス依存の軟式接頭辞は、多クラス分類における言語動詞化を補完するために利用される。
論文 参考訳(メタデータ) (2022-11-11T03:45:59Z) - Compositional Temporal Grounding with Structured Variational Cross-Graph
Correspondence Learning [92.07643510310766]
ビデオの時間的接地は、あるクエリ文に意味的に対応する1つのターゲットビデオセグメントをローカライズすることを目的としている。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
出現した単語の新たな組み合わせによるクエリの一般化に失敗したことを実証的に見出した。
本稿では,ビデオと言語を複数の階層構造に明示的に分解する多変分グラフ推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-24T12:55:23Z) - Finding Variants for Construction-Based Dialectometry: A Corpus-Based
Approach to Regional CxGs [0.0]
本論文では,未知の構造を同定できる構造的方言測定法を開発した。
変動を受ける構造の集合を事前に制限することなく、地域CxG間の集合的類似度を測定する方法を提供する。
論文 参考訳(メタデータ) (2021-04-03T02:52:14Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。