論文の概要: Measuring diachronic sense change: new models and Monte Carlo methods
for Bayesian inference
- arxiv url: http://arxiv.org/abs/2105.00819v1
- Date: Wed, 14 Apr 2021 11:40:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 20:42:01.225567
- Title: Measuring diachronic sense change: new models and Monte Carlo methods
for Bayesian inference
- Title(参考訳): ダイアクロニックな感覚変化の測定--ベイズ推定のための新しいモデルとモンテカルロ法
- Authors: Schyan Zafar and Geoff Nicholls
- Abstract要約: 単語の袋モデルでは、複数の意味を持つ単語の感覚を文脈語上の確率分布として表現する。
既存の生成感覚変化モデルを適用し、感覚と時間の主な効果のためのより単純なモデルを開発する。
本モデルを用いて「コスモス」を含むスニペットの自動感覚アノテーションを行い、その3つの感覚の時間進化とその有病率を測定します。
- 参考スコア(独自算出の注目度): 3.1727619150610837
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In a bag-of-words model, the senses of a word with multiple meanings, e.g.
"bank" (used either in a river-bank or an institution sense), are represented
as probability distributions over context words, and sense prevalence is
represented as a probability distribution over senses. Both of these may change
with time. Modelling and measuring this kind of sense change is challenging due
to the typically high-dimensional parameter space and sparse datasets. A
recently published corpus of ancient Greek texts contains expert-annotated
sense labels for selected target words. Automatic sense-annotation for the word
"kosmos" (meaning decoration, order or world) has been used as a test case in
recent work with related generative models and Monte Carlo methods. We adapt an
existing generative sense change model to develop a simpler model for the main
effects of sense and time, and give MCMC methods for Bayesian inference on all
these models that are more efficient than existing methods. We carry out
automatic sense-annotation of snippets containing "kosmos" using our model, and
measure the time-evolution of its three senses and their prevalence. As far as
we are aware, ours is the first analysis of this data, within the class of
generative models we consider, that quantifies uncertainty and returns credible
sets for evolving sense prevalence in good agreement with those given by expert
annotation.
- Abstract(参考訳): bag-of-wordsモデルでは、単語の感覚には複数の意味がある。
バンク(川岸または施設感覚で用いられる)は文脈語の確率分布として表現され、感覚の頻度分布は感覚の確率分布として表現される。
どちらも時間とともに変わる可能性がある。
このような感覚変化のモデル化と測定は、一般的に高次元のパラメータ空間とスパースデータセットのために難しい。
最近出版された古代ギリシア語のテキストのコーパスには、選択されたターゲット語の専門的な注釈付きセンスラベルが含まれている。
コスモス(kosmos、装飾、秩序、世界を意味する)という単語の自動アノテーションは、最近、関連する生成モデルやモンテカルロ法を用いてテストケースとして使われている。
我々は、既存の生成感覚変化モデルを適用し、感覚と時間の主な効果に対するより単純なモデルを開発し、既存の手法よりも効率的であるこれらのモデルに対して、ベイズ推定のためのMCMC法を与える。
我々は,このモデルを用いて「コスモス」を含むスニペットの自動認識を行い,その3つの感覚の時間進化とその頻度を測定する。
我々の知る限り、このデータの最初の分析は、我々が考慮する生成モデルの中で、不確実性を定量化し、専門家のアノテーションによって与えられたものとうまく一致して、感覚の有病率を進化させるための信頼できる集合を返すものである。
関連論文リスト
- Human-in-the-loop: Towards Label Embeddings for Measuring Classification Difficulty [14.452983136429967]
教師付き学習では、トレーニングプロセスの第1段階、つまりアノテーションフェーズにおいて、すでに不確実性が発生する可能性がある。
この研究の主な考え方は、基礎となる真理ラベルの仮定を捨て、代わりにアノテーションを多次元空間に埋め込むことである。
本稿では,複数のアノテータが独立してインスタンスをラベル付けする,様々な状況に展開する手法を提案する。
論文 参考訳(メタデータ) (2023-11-15T11:23:15Z) - An Embedded Diachronic Sense Change Model with a Case Study from Ancient Greek [0.4143603294943439]
本稿では,単語埋め込みを言語と組み合わせ,優れたモデル性能を提供する組込みモデルであるEDiSCを紹介する。
EDiSCは、精度の向上、地道回復、不確実性定量化を提供する。
論文 参考訳(メタデータ) (2023-11-01T14:20:18Z) - On the Efficacy of Sampling Adapters [82.5941326570812]
サンプリングアダプタを理解するための統一的なフレームワークを提案する。
彼らが実施するシフトは、正確さとリコールの間のトレードオフと見なすことができる、と私たちは主張する。
いくつかの精度強調尺度は、サンプリングアダプタが真の分布とより整合した確率分布をもたらすことを確実に示している。
論文 参考訳(メタデータ) (2023-07-07T17:59:12Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - A moment-matching metric for latent variable generative models [0.0]
グッドハートの法則の範囲では、計量が対象となるとき、それは良い計量になるのをやめる。
モーメントに依存するモデル比較や正規化のための新しい指標を提案する。
潜時変動モデルを評価する際に, 適応分布からサンプルを抽出することが一般的である。
論文 参考訳(メタデータ) (2021-10-04T17:51:08Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - MASKER: Masked Keyword Regularization for Reliable Text Classification [73.90326322794803]
文脈に基づく予測を容易にする微調整手法であるマスク付きキーワード正規化(MASKER)を提案する。
maskerはモデルを規則化し、他の単語からキーワードを再構築し、十分な文脈なしに低信頼の予測を行う。
分類精度を低下させることなくOOD検出とクロスドメインの一般化を改善したMASKERを提案する。
論文 参考訳(メタデータ) (2020-12-17T04:54:16Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - Modelling Lexical Ambiguity with Density Matrices [3.7692411550925664]
コーパスから密度行列を学習するための3つの新しいニューラルモデルを提案する。
様々な構成データセットで単語感覚を識別する能力をテストする。
論文 参考訳(メタデータ) (2020-10-12T13:08:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。