論文の概要: An Accurate Model for Predicting the (Graded) Effect of Context in Word
Similarity Based on Bert
- arxiv url: http://arxiv.org/abs/2005.01006v3
- Date: Wed, 22 Jul 2020 03:03:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 06:16:00.769193
- Title: An Accurate Model for Predicting the (Graded) Effect of Context in Word
Similarity Based on Bert
- Title(参考訳): Bertに基づく単語類似性における文脈の(段階的な)効果を予測する高精度モデル
- Authors: Wei Bao, Hongshu Che, Jiandong Zhang
- Abstract要約: 我々は、文脈が類似した単語の人間の知覚に与える影響を分析し、SemEval 2020の3番目の課題である。
我々のチームはフィンランド語トラックのsubtask1で1位を獲得し、英語トラックのsubtask1で2位となった。
- 参考スコア(独自算出の注目度): 15.518596319633609
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Natural Language Processing (NLP) has been widely used in the semantic
analysis in recent years. Our paper mainly discusses a methodology to analyze
the effect that context has on human perception of similar words, which is the
third task of SemEval 2020. We apply several methods in calculating the
distance between two embedding vector generated by Bidirectional Encoder
Representation from Transformer (BERT). Our team will_go won the 1st place in
Finnish language track of subtask1, the second place in English track of
subtask1.
- Abstract(参考訳): 自然言語処理(NLP)は近年,意味解析に広く用いられている。
本稿は,SemEval 2020の3番目の課題である,文脈が類似語に対する人間の知覚に与える影響を分析する方法論を主に論じる。
変換器(BERT)からの双方向エンコーダ表現によって生成される2つの埋め込みベクトル間の距離を計算するために,いくつかの手法を適用する。
我々のチームはフィンランド語トラックのsubtask1で1位を獲得し、英語トラックのsubtask1で2位となった。
関連論文リスト
- Predicting Word Similarity in Context with Referential Translation Machines [0.0]
タスクを機械翻訳性能予測(MTPP)としてキャストすることで、英語の2単語間の類似性を識別する。
我々は、トレーニングとテストセットの共通表現を可能にするレファレンシャル翻訳機械(RTM)を使用している。
RTMは、グレードドドワード類似性(GWSC)タスクの上位結果を達成することができる。
論文 参考訳(メタデータ) (2024-07-07T09:36:41Z) - Unsupervised Chunking with Hierarchical RNN [62.15060807493364]
本稿では,非階層的手法で単語をグループ化する構文的タスクであるチャンキングに対する教師なしアプローチを紹介する。
本稿では,単語-チャンク・チャンク-文合成をモデル化した2層階層型階層型リカレントニューラルネットワーク(HRNN)を提案する。
CoNLL-2000データセットの実験では、既存の教師なし手法よりも顕著な改善が見られ、フレーズF1スコアが最大6ポイント向上した。
論文 参考訳(メタデータ) (2023-09-10T02:55:12Z) - Optimal Transport Posterior Alignment for Cross-lingual Semantic Parsing [68.47787275021567]
言語間のセマンティックパーシングは、高いソース言語(例えば英語)から少ないトレーニングデータを持つ低リソース言語へのパーシング能力を伝達する。
そこで本稿では,最適輸送を用いた係り受け変数間の言語間相違を明示的に最小化することで,言語間セマンティック解析のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-09T04:52:31Z) - Bag of Tricks for Effective Language Model Pretraining and Downstream
Adaptation: A Case Study on GLUE [93.98660272309974]
このレポートでは、ジェネラル言語理解評価のリーダーボードに関するVega v1を簡潔に紹介します。
GLUEは、質問応答、言語受容性、感情分析、テキスト類似性、パラフレーズ検出、自然言語推論を含む9つの自然言語理解タスクのコレクションである。
最適化された事前学習と微調整の戦略により、13億のモデルは4/9タスクに新しい最先端のタスクを設定し、91.3の平均スコアを達成しました。
論文 参考訳(メタデータ) (2023-02-18T09:26:35Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Language Model Metrics and Procrustes Analysis for Improved Vector
Transformation of NLP Embeddings [4.061135251278187]
鍵となる問題は、NLP埋め込み空間におけるベクトル間の類似性や距離を測定することである。
ベクトル間の言語距離を測る最良の方法は、それらを生成する言語モデル(LM)を利用することである。
バイリンガル単語マッピングのためのProcrustesアルゴリズムを学習する単純なニューラルネットワークに適用することにより,この指標の有効性を示す。
論文 参考訳(メタデータ) (2021-06-04T13:56:10Z) - Training Bi-Encoders for Word Sense Disambiguation [4.149972584899897]
Word Sense Disambiguationの最先端のアプローチは、これらのモデルからの事前訓練された埋め込みとともに語彙情報を活用し、標準評価ベンチマークにおける人間間のアノテータ合意に匹敵する結果を得る。
我々はさらに,多段階事前学習および微調整パイプラインを通じて,Word Sense Disambiguationにおける技術の現状について述べる。
論文 参考訳(メタデータ) (2021-05-21T06:06:03Z) - NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for
Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。
その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。
本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文 参考訳(メタデータ) (2020-11-07T11:27:18Z) - UiO-UvA at SemEval-2020 Task 1: Contextualised Embeddings for Lexical
Semantic Change Detection [5.099262949886174]
本稿では,時とともに意味的ドリフトの度合いで単語をランク付けするSubtask 2に焦点を当てた。
最も効果的なアルゴリズムは、平均的なトークン埋め込みとトークン埋め込み間のペア距離のコサイン類似性に依存する。
論文 参考訳(メタデータ) (2020-04-30T18:43:57Z) - Generating Word and Document Embeddings for Sentiment Analysis [0.36525095710982913]
本稿では、文脈情報と教師付き情報と、辞書に現れる単語の一般的な意味表現を組み合わせる。
トルコの映画ドメインとTwitterデータセットである2つのコーパスに対して、ドメイン固有の感情ベクトルを誘導する。
これは我々のアプローチがクロスドメインであり、他の言語に移植可能であることを示している。
論文 参考訳(メタデータ) (2020-01-05T16:34:32Z) - Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。
提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。
また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文 参考訳(メタデータ) (2019-12-28T16:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。