論文の概要: QMUL-SDS @ DIACR-Ita: Evaluating Unsupervised Diachronic Lexical
Semantics Classification in Italian
- arxiv url: http://arxiv.org/abs/2011.02935v2
- Date: Fri, 6 Nov 2020 17:08:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 11:57:40.390538
- Title: QMUL-SDS @ DIACR-Ita: Evaluating Unsupervised Diachronic Lexical
Semantics Classification in Italian
- Title(参考訳): QMUL-SDS @ DIACR-Ita:Evaluating Unsupervised Diachronic Lexical Semantics Classification in Italian
- Authors: Rabab Alkhalifa, Adam Tsakalidis, Arkaitz Zubiaga, Maria Liakata
- Abstract要約: 本稿では,DIACR-ITA 2020タスクの成果と主な成果について述べる。
このタスクは、2つのダイアクロニック・イタリアのコーパスから単語のベクトル変化を訓練し、調整し、予測することである。
我々のモデルは83.3%の精度で3位にランクインした。
- 参考スコア(独自算出の注目度): 28.295390526029415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present the results and main findings of our system for the
DIACR-ITA 2020 Task. Our system focuses on using variations of training sets
and different semantic detection methods. The task involves training, aligning
and predicting a word's vector change from two diachronic Italian corpora. We
demonstrate that using Temporal Word Embeddings with a Compass C-BOW model is
more effective compared to different approaches including Logistic Regression
and a Feed Forward Neural Network using accuracy. Our model ranked 3rd with an
accuracy of 83.3%.
- Abstract(参考訳): 本稿では,DIACR-ITA 2020タスクにおけるシステムの結果と主な成果について述べる。
本システムでは,トレーニングセットのバリエーションと意味検出手法の相違に着目した。
タスクは、単語のベクトル変化を2つのダイアクロニックなイタリア語コーパスから訓練し、調整し、予測することである。
コンパスC-BOWモデルを用いたテンポラルワード埋め込みは,ロジスティック回帰やフィードフォワードニューラルネットワークなど,精度の高いアプローチに比べ,より効果的であることを示す。
我々のモデルは83.3%の精度で3位となった。
関連論文リスト
- System Report for CCL24-Eval Task 7: Multi-Error Modeling and Fluency-Targeted Pre-training for Chinese Essay Evaluation [1.8856984887896766]
我々は,中国語学習者4Wコーパス上で,二分分類モデルと訓練された粗粒度モデルを用いて,細粒度エラーの予測を最適化した。
トラック2では、文毎に複数のエラー型を持つ擬似データセットを構築することにより、性能を向上した。
1位となったトラック3では,事前学習のための逆翻訳によって流速評価の擬似データを生成し,NSPベースの戦略を用いた。
論文 参考訳(メタデータ) (2024-07-11T06:17:08Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Neural Coreference Resolution based on Reinforcement Learning [53.73316523766183]
コアレゾリューションシステムは2つのサブタスクを解決する必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクターをベースとした強化学習型ニューラルコア参照分解システムを提案する。
論文 参考訳(メタデータ) (2022-12-18T07:36:35Z) - Revisiting Distance Metric Learning for Few-Shot Natural Language
Classification [1.0323063834827415]
数ショットの学習設定では、特にプロキシベースのDML損失は、教師付き言語モデルの微調整と推論に肯定的な影響を及ぼす可能性がある。
CCEとProxyAnchor Lossの組み合わせで調整されたモデルは、平均すると、CCEのみが3.27ポイントの最高のパフォーマンスとパフォーマンスのモデルである。
論文 参考訳(メタデータ) (2022-11-28T10:19:31Z) - 1Cademy at Semeval-2022 Task 1: Investigating the Effectiveness of
Multilingual, Multitask, and Language-Agnostic Tricks for the Reverse
Dictionary Task [13.480318097164389]
本稿では,SemEval2022タスクの逆辞書トラックに着目し,単語の埋め込みと辞書のグルースをマッチングする。
モデルは文の入力をSGNS、Char、Electraの3種類の埋め込みに変換する。
提案するElmoベースの単言語モデルが最も高い結果を得る。
論文 参考訳(メタデータ) (2022-06-08T06:39:04Z) - Exploration and Exploitation: Two Ways to Improve Chinese Spelling
Correction Models [51.744357472072416]
本稿では,モデルの弱点を継続的に識別し,より価値の高いトレーニングインスタンスを生成する手法を提案する。
実験結果から, 事前学習戦略と組み合わさって, 複数のCSCモデルの一般化とロバスト性を改善することができることがわかった。
論文 参考訳(メタデータ) (2021-05-31T09:17:33Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - RethinkCWS: Is Chinese Word Segmentation a Solved Task? [81.11161697133095]
中国語の単語(CWS)システムの性能は、ディープニューラルネットワークの急速な発展とともに、徐々に高水準に達している。
本稿では、私たちが達成した事柄の株式を取得し、CWSタスクに残されている事柄を再考する。
論文 参考訳(メタデータ) (2020-11-13T11:07:08Z) - NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for
Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。
その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。
本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文 参考訳(メタデータ) (2020-11-07T11:27:18Z) - OP-IMS @ DIACR-Ita: Back to the Roots: SGNS+OP+CD still rocks Semantic
Change Detection [19.31318149094267]
我々は,Skip-GramとNegative Smplingに基づく最初期の,最も影響力のある意味変化検出モデルを利用する。
完全に近い精度で共有タスクの入賞申請を得る。
提案手法は,語彙意味変化検出における現在のタスク設定において,従来の型ベースアプローチが優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-11-06T10:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。