論文の概要: Letters From the Past: Modeling Historical Sound Change Through
Diachronic Character Embeddings
- arxiv url: http://arxiv.org/abs/2205.08256v1
- Date: Tue, 17 May 2022 11:57:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-18 14:01:46.679065
- Title: Letters From the Past: Modeling Historical Sound Change Through
Diachronic Character Embeddings
- Title(参考訳): 過去の手紙:ダイアクロニック・キャラクタの埋め込みによる歴史的音質変化のモデル化
- Authors: Sidsel Boldsen and Patrizia Paggio
- Abstract要約: 歴史的綴りによる音質変化の検出に対処する。
PPMI文字埋め込みを用いて,分布間の時間的距離を比較することで,音質変化を捉えることができることを示す。
モデルが検討中のいくつかの変更を識別し、それらが現れる意味のあるコンテキストを明らかにすることができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While a great deal of work has been done on NLP approaches to lexical
semantic change detection, other aspects of language change have received less
attention from the NLP community. In this paper, we address the detection of
sound change through historical spelling. We propose that a sound change can be
captured by comparing the relative distance through time between their
distributions using PPMI character embeddings. We verify this hypothesis in
synthetic data and then test the method's ability to trace the well-known
historical change of lenition of plosives in Danish historical sources. We show
that the models are able to identify several of the changes under consideration
and to uncover meaningful contexts in which they appeared. The methodology has
the potential to contribute to the study of open questions such as the relative
chronology of sound shifts and their geographical distribution.
- Abstract(参考訳): 語彙的意味変化検出に対するNLPアプローチに関して、多くの研究が行われてきたが、言語変更の他の側面は、NLPコミュニティからあまり注目されていない。
本稿では,歴史的綴りによる音変化の検出について述べる。
PPMI文字埋め込みを用いて,分布間の時間的距離を比較することで,音質変化を捉えることができることを示す。
この仮説を合成データで検証し、デンマークの史料に記録された文書の貸付の歴史的変遷を追跡する手法の能力を検証した。
モデルが検討中の変更のいくつかを識別し、それらが現れる意味のあるコンテキストを明らかにすることができることを示す。
この方法論は、音の相対時間や地理的分布といったオープンな疑問の研究に寄与する可能性がある。
関連論文リスト
- Exploring Sound Change Over Time: A Review of Computational and Human Perception [2.8908326904081334]
我々は,手法やタスクの観点から,人間の知覚と計算を対比した先駆的なレビューを提供する。
全体として、計算手法はコンピュータ駆動モデルに頼り、語源的データセットの歴史的音響変化を知覚する。
人間のアプローチは、録音コーパスにおける継続的な音の変化を知覚するためにリスナー駆動モデルを使用する。
論文 参考訳(メタデータ) (2024-07-06T14:44:59Z) - Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio
Detection [54.20974251478516]
本稿では,破滅的な忘れを克服するために,偽音声検出のための連続学習アルゴリズムを提案する。
検出ネットワークを微調整する場合,本手法では,真の発話と偽発話の比率に応じて,重み付けの方向を適応的に計算する。
本手法は,音声の感情認識などの関連分野に容易に一般化できる。
論文 参考訳(メタデータ) (2023-08-07T05:05:49Z) - Reliable Detection and Quantification of Selective Forces in Language
Change [3.55026004901472]
我々は,最近導入された手法をコーパスデータに適用し,歴史的言語変化の特定の事例における選択の強さを定量化する。
本手法は,従来適用されてきた類似手法よりも信頼性が高く,解釈可能であることを示す。
論文 参考訳(メタデータ) (2023-05-25T10:20:15Z) - Measuring Intersectional Biases in Historical Documents [37.03904311548859]
植民地時代(18世紀から19世紀)にカリブ海で発行された歴史新聞におけるバイアスの連続性と変化について検討する。
私たちの分析は、性別、人種、およびそれらの交点の軸に沿って行われます。
単語埋め込みの安定性と、過去のデータセットとの互換性の間にはトレードオフがあることが分かりました。
論文 参考訳(メタデータ) (2023-05-21T07:10:31Z) - Stability of Syntactic Dialect Classification Over Space and Time [0.0]
本稿では,12の方言を対象に,月々の間隔で3年間にまたがる英語の12の方言を対象に,1120都市にまたがる空間分布を定式化するテストセットを構築した。
各方言の分類性能の劣化率は時間とともに減少し,統語的変化を受ける地域を特定することができる。
また、方言領域における分類精度の分布により、方言の文法が内部的に不均一である程度を特定できる。
論文 参考訳(メタデータ) (2022-09-11T23:14:59Z) - Contextualized language models for semantic change detection: lessons
learned [4.436724861363513]
本稿では,ダイアクロニック・セマンティック・チェンジを検出する文脈的埋め込みに基づく手法の出力の質的分析を行う。
本研究の結果から,文脈化手法は,実際のダイアクロニック・セマンティック・シフトを行なわない単語に対して,高い変化スコアを予測できることが示唆された。
我々の結論は、事前学習された文脈化言語モデルは、語彙感覚の変化と文脈分散の変化を補う傾向にあるということである。
論文 参考訳(メタデータ) (2022-08-31T23:35:24Z) - Combating Temporal Drift in Crisis with Adapted Embeddings [58.4558720264897]
言語の使用は時間とともに変化し、NLPシステムの有効性に影響を与える可能性がある。
本研究は,危機時の言論変化に対応する方法を検討する。
論文 参考訳(メタデータ) (2021-04-17T13:11:41Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。