論文の概要: MWE as WSD: Solving Multiword Expression Identification with Word Sense
Disambiguation
- arxiv url: http://arxiv.org/abs/2303.06623v1
- Date: Sun, 12 Mar 2023 09:35:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 17:44:16.518308
- Title: MWE as WSD: Solving Multiword Expression Identification with Word Sense
Disambiguation
- Title(参考訳): MWE as WSD: 単語センスの曖昧さによるマルチワード表現の同定
- Authors: Joshua Tanner and Jacob Hoffman
- Abstract要約: MWE候補をフィルタするために,光沢とコンテキスト情報を用いたビエンコーダモデルを訓練する。
我々は,DIMUMデータセット上でのMWE識別とPARSEME 1.1の英語データセット上での競合結果について,最先端の結果を得た。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent work in word sense disambiguation (WSD) utilizes encodings of the
sense gloss (definition text), in addition to the input words and context, to
improve performance. In this work we demonstrate that this approach can be
adapted for use in multiword expression (MWE) identification by training a
Bi-encoder model which uses gloss and context information to filter MWE
candidates produced from a simple rule-based extraction pipeline. We achieve
state-of-the-art results in MWE identification on the DiMSUM dataset, and
competitive results on the PARSEME 1.1 English dataset using this method. Our
model also retains most of its ability to perform WSD, demonstrating that a
single model can successfully be applied to both of these tasks. Additionally,
we experiment with applying Poly-encoder models to MWE identification and WSD,
introducing a modified Poly-encoder architecture which outperforms the standard
Poly-encoder on these tasks.
- Abstract(参考訳): 近年のWSD(Word sense disambiguation)では,入力語や文脈に加えて,センスグロス(定義文)のエンコーディングを利用して性能を向上させる。
本研究では,単純なルールベース抽出パイプラインから生成したMWE候補をグロスとコンテキスト情報を用いて抽出するバイエンコーダモデルを訓練することにより,マルチワード表現(MWE)識別に適用可能であることを示す。
本手法を用いて,DIMUMデータセット上でのMWE識別とPARSEME 1.1英語データセットにおける競合結果の最先端化を実現した。
我々のモデルは、WSDを実行する能力のほとんどを保持しており、一つのモデルがこれらのタスクの両方にうまく適用できることを示しています。
さらに、MWE識別とWSDにポリエンコーダモデルを適用し、それらのタスクにおいて標準のポリエンコーダよりも優れる改良されたポリエンコーダアーキテクチャを導入する実験を行った。
関連論文リスト
- Enhancing Modern Supervised Word Sense Disambiguation Models by Semantic
Lexical Resources [11.257738983764499]
現在、Word Sense Disambiguation (WSD) の監視モデルは、最も人気のあるベンチマークで最先端の結果をもたらす。
我々は、WordNetとWordNet Domainsという2つの人気のあるSLRを利用する「モダンな」教師付きWSDモデルを強化する。
本研究では,単語埋め込みやリカレントニューラルネットワークの混合によって符号化された局所的文脈との相互作用について,異なるタイプの意味的特徴の影響について検討する。
論文 参考訳(メタデータ) (2024-02-20T13:47:51Z) - FLIP: Fine-grained Alignment between ID-based Models and Pretrained Language Models for CTR Prediction [49.510163437116645]
クリックスルーレート(CTR)予測は、パーソナライズされたオンラインサービスにおいてコア機能モジュールとして機能する。
CTR予測のための従来のIDベースのモデルは、表形式の1ホットエンコードされたID特徴を入力として取る。
事前訓練された言語モデル(PLM)は、テキストのモダリティの文を入力として取る別のパラダイムを生み出した。
本稿では,CTR予測のためのIDベースモデルと事前学習言語モデル(FLIP)間の細粒度特徴レベルのアライメントを提案する。
論文 参考訳(メタデータ) (2023-10-30T11:25:03Z) - Co-Driven Recognition of Semantic Consistency via the Fusion of
Transformer and HowNet Sememes Knowledge [6.184249194474601]
本稿では,Transformer と HowNet のセメム知識の融合に基づく協調型意味的一貫性認識手法を提案する。
BiLSTMは概念的意味情報をエンコードし、意味的一貫性を推測するために利用される。
論文 参考訳(メタデータ) (2023-02-21T09:53:19Z) - Using Deep Mixture-of-Experts to Detect Word Meaning Shift for TempoWiC [0.9543943371833467]
本稿では、マクロF1スコア77.05%のTempoWiCタスクへのdma提出について述べる。
さらに改良するために,Mixture-of-Experts (MoE) アプローチを用いてPOS情報と単語意味表現を統合する。
論文 参考訳(メタデータ) (2022-11-07T11:28:34Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Exploring Multi-Modal Representations for Ambiguity Detection &
Coreference Resolution in the SIMMC 2.0 Challenge [60.616313552585645]
会話型AIにおける効果的なあいまいさ検出と参照解決のためのモデルを提案する。
具体的には,TOD-BERTとLXMERTをベースとしたモデルを用いて,多数のベースラインと比較し,アブレーション実験を行う。
以上の結果から,(1)言語モデルでは曖昧さを検出するためにデータの相関を活用でき,(2)言語モデルではビジョンコンポーネントの必要性を回避できることがわかった。
論文 参考訳(メタデータ) (2022-02-25T12:10:02Z) - Meta-Learning with Variational Semantic Memory for Word Sense
Disambiguation [56.830395467247016]
メタ学習環境におけるWSDのセマンティックメモリモデルを提案する。
我々のモデルは階層的変動推論に基づいており、ハイパーネットワークを介して適応的なメモリ更新ルールを組み込んでいる。
極めて少ないシナリオでの効果的な学習を支援するために,本モデルがWSDで最先端の技術を数ショットで実現していることを示す。
論文 参考訳(メタデータ) (2021-06-05T20:40:01Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Referring Image Segmentation via Cross-Modal Progressive Comprehension [94.70482302324704]
画像セグメンテーションの参照は、自然言語表現で与えられた記述によく一致するエンティティの前景マスクをセグメンテーションすることを目的としている。
従来のアプローチでは、暗黙的な特徴相互作用と視覚的モダリティと言語的モダリティの融合を用いてこの問題に対処していた。
本稿では,この課題に効果的に対応するために,Cross-Modal Progressive (CMPC) モジュールと Text-Guided Feature Exchange (TGFE) モジュールを提案する。
論文 参考訳(メタデータ) (2020-10-01T16:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。