論文の概要: An Embedded Diachronic Sense Change Model with a Case Study from Ancient
Greek
- arxiv url: http://arxiv.org/abs/2311.00541v1
- Date: Wed, 1 Nov 2023 14:20:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 13:30:58.733771
- Title: An Embedded Diachronic Sense Change Model with a Case Study from Ancient
Greek
- Title(参考訳): 組込みダイアクロニック感覚変化モデル : 古代ギリシア語を事例として
- Authors: Schyan Zafar, Geoff K. Nicholls
- Abstract要約: 本稿では,単語埋め込みと意味を組み合わせることで,優れたモデル性能を実現するEDiSCを提案する。
EDiSCは,予測精度の向上,地道回復,不確実性定量化を実現している。
- 参考スコア(独自算出の注目度): 0.48951183832371004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Word meanings change over time, and word senses evolve, emerge or die out in
the process. For ancient languages, where the corpora are often small, sparse
and noisy, modelling such changes accurately proves challenging, and
quantifying uncertainty in sense-change estimates consequently becomes
important. GASC and DiSC are existing generative models that have been used to
analyse sense change for target words from an ancient Greek text corpus, using
unsupervised learning without the help of any pre-training. These models
represent the senses of a given target word such as "kosmos" (meaning
decoration, order or world) as distributions over context words, and sense
prevalence as a distribution over senses. The models are fitted using MCMC
methods to measure temporal changes in these representations. In this paper, we
introduce EDiSC, an embedded version of DiSC, which combines word embeddings
with DiSC to provide superior model performance. We show empirically that EDiSC
offers improved predictive accuracy, ground-truth recovery and uncertainty
quantification, as well as better sampling efficiency and scalability
properties with MCMC methods. We also discuss the challenges of fitting these
models.
- Abstract(参考訳): 単語の意味は時間とともに変化し、単語の感覚は進化、出現または消滅する。
コーパスが小さく、ばらばらで騒がしい古代言語では、そのような変化を正確にモデル化することは困難を証明し、感覚変化推定における不確実性を定量化することが重要となる。
GASCとDiSCは、事前学習の助けなしに教師なし学習を用いて、古代ギリシア語のテキストコーパスからターゲット語に対する感覚変化を分析するために使われている既存の生成モデルである。
これらのモデルは、文脈語上の分布として「コスモス(kosmos)」などの特定の対象語の感覚を表現し、感覚上の分布として有能さを知覚する。
モデルはMCMC法を用いてこれらの表現の時間的変化を測定する。
本稿では,単語埋め込みとDiSCを組み合わせることで,優れたモデル性能を実現するDiSCの組込み版であるEDiSCを紹介する。
EDiSCは,MCMC法によるサンプリング効率と拡張性の向上とともに,予測精度の向上,地道回復,不確実性定量化を実現している。
また,これらのモデルの適合に関する課題についても考察する。
関連論文リスト
- PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは,ポイントマスク自動エンコーダのグローバルな特徴表現を強化する,自己教師型学習フレームワークである。
PseudoNeg-MAE は ModelNet40 と ScanObjectNN のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - SSCAE -- Semantic, Syntactic, and Context-aware natural language Adversarial Examples generator [0.44998333629984877]
機械学習モデルは悪質に作られたAdversarial Examples(AEs)に脆弱である
本稿では,textbfSemantic, textbfSyntactic, textbfContext-aware natural language textbfAEs ジェネレータに対するSSCAEと呼ばれる実用的で効率的な攻撃モデルを提案する。
論文 参考訳(メタデータ) (2024-03-18T14:45:20Z) - Semantic Sensitivities and Inconsistent Predictions: Measuring the
Fragility of NLI Models [44.56781176879151]
State-of-the-art Natural Language Inference (NLI)モデルは、表面形状の変化を保存するマイナーセマンティクスに敏感である。
セマンティックな感度は、平均$textbfin-$と$textbfout-of-$ドメイン設定よりも平均$12.92%と$23.71%のパフォーマンス劣化を引き起こす。
論文 参考訳(メタデータ) (2024-01-25T14:47:05Z) - Calibration of Time-Series Forecasting: Detecting and Adapting Context-Driven Distribution Shift [28.73747033245012]
本稿では,コンテキスト駆動分布シフトの検出と適応のための普遍的キャリブレーション手法を提案する。
レジデンシャルベースCDS検出器(Residual-based CDS detector)またはリコンディショナー(Reconditionor)と呼ばれる新しいCDS検出器は、モデルの脆弱性をCDSに定量化する。
高いリコンディショナースコアは、重度の感受性を示し、したがってモデル適応を必要とする。
論文 参考訳(メタデータ) (2023-10-23T11:58:01Z) - Contextualized language models for semantic change detection: lessons
learned [4.436724861363513]
本稿では,ダイアクロニック・セマンティック・チェンジを検出する文脈的埋め込みに基づく手法の出力の質的分析を行う。
本研究の結果から,文脈化手法は,実際のダイアクロニック・セマンティック・シフトを行なわない単語に対して,高い変化スコアを予測できることが示唆された。
我々の結論は、事前学習された文脈化言語モデルは、語彙感覚の変化と文脈分散の変化を補う傾向にあるということである。
論文 参考訳(メタデータ) (2022-08-31T23:35:24Z) - ER: Equivariance Regularizer for Knowledge Graph Completion [107.51609402963072]
我々は、新しい正規化器、すなわち等分散正規化器(ER)を提案する。
ERは、頭と尾のエンティティ間の意味的等価性を利用することで、モデルの一般化能力を高めることができる。
実験結果から,最先端関係予測法よりも明確かつ実質的な改善が示された。
論文 参考訳(メタデータ) (2022-06-24T08:18:05Z) - Meta-Learning with Variational Semantic Memory for Word Sense
Disambiguation [56.830395467247016]
メタ学習環境におけるWSDのセマンティックメモリモデルを提案する。
我々のモデルは階層的変動推論に基づいており、ハイパーネットワークを介して適応的なメモリ更新ルールを組み込んでいる。
極めて少ないシナリオでの効果的な学習を支援するために,本モデルがWSDで最先端の技術を数ショットで実現していることを示す。
論文 参考訳(メタデータ) (2021-06-05T20:40:01Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z) - Measuring diachronic sense change: new models and Monte Carlo methods
for Bayesian inference [3.1727619150610837]
単語の袋モデルでは、複数の意味を持つ単語の感覚を文脈語上の確率分布として表現する。
既存の生成感覚変化モデルを適用し、感覚と時間の主な効果のためのより単純なモデルを開発する。
本モデルを用いて「コスモス」を含むスニペットの自動感覚アノテーションを行い、その3つの感覚の時間進化とその有病率を測定します。
論文 参考訳(メタデータ) (2021-04-14T11:40:21Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。