論文の概要: PEL-BERT: A Joint Model for Protocol Entity Linking
- arxiv url: http://arxiv.org/abs/2002.00744v1
- Date: Tue, 28 Jan 2020 16:42:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 01:58:02.779840
- Title: PEL-BERT: A Joint Model for Protocol Entity Linking
- Title(参考訳): PEL-BERT:プロトコルエンティティリンクのための統合モデル
- Authors: Shoubin Li, Wenzao Cui, Yujiang Liu, Xuran Ming, Jun Hu, YuanzheHu,
Qing Wang
- Abstract要約: 本稿では,細調整言語モデルとRFCドメインモデルとを結合するモデルを提案する。
第1に,プロトコル EL のガイドラインとしてプロトコル知識ベースを設計する。第2に,プロトコル内の名前付きエンティティをプロトコル知識ベース内のカテゴリにリンクする新しいモデル PEL-BERT を提案する。
実験結果から,アノテートされたデータセット上でのELの最先端性能が得られた。
- 参考スコア(独自算出の注目度): 6.5191667029024805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pre-trained models such as BERT are widely used in NLP tasks and are
fine-tuned to improve the performance of various NLP tasks consistently.
Nevertheless, the fine-tuned BERT model trained on our protocol corpus still
has a weak performance on the Entity Linking (EL) task. In this paper, we
propose a model that joints a fine-tuned language model with an RFC Domain
Model. Firstly, we design a Protocol Knowledge Base as the guideline for
protocol EL. Secondly, we propose a novel model, PEL-BERT, to link named
entities in protocols to categories in Protocol Knowledge Base. Finally, we
conduct a comprehensive study on the performance of pre-trained language models
on descriptive texts and abstract concepts. Experimental results demonstrate
that our model achieves state-of-the-art performance in EL on our annotated
dataset, outperforming all the baselines.
- Abstract(参考訳): BERTのような事前訓練されたモデルはNLPタスクで広く使われ、様々なNLPタスクのパフォーマンスを継続的に改善するために微調整されている。
それでも、私たちのプロトコルコーパスでトレーニングされた細調整されたBERTモデルは、Entity Linking (EL)タスクでは依然として弱いパフォーマンスです。
本稿では,細調整言語モデルとRFCドメインモデルとを結合するモデルを提案する。
まず,プロトコルelのガイドラインとしてプロトコル知識ベースを設計する。
次に、プロトコル内の名前付きエンティティをプロトコル知識ベース内のカテゴリにリンクする新しいモデル PEL-BERT を提案する。
最後に,記述文や抽象概念を用いた事前学習言語モデルの性能に関する総合的研究を行う。
実験結果から,アノテートされたデータセット上でのELの最先端性能が得られた。
関連論文リスト
- Test-Time Training on Graphs with Large Language Models (LLMs) [68.375487369596]
グラフニューラルネットワーク(GNN)をトレーニングするための有望なアプローチとして,TTT(Test-Time Training)が提案されている。
テキスト分散グラフ(TAG)上でのLLM(Large Language Models)の優れたアノテーション能力に着想を得て,LLMをアノテータとしてグラフ上でのテスト時間トレーニングを強化することを提案する。
2段階のトレーニング戦略は、限定的でノイズの多いラベルでテストタイムモデルを調整するように設計されている。
論文 参考訳(メタデータ) (2024-04-21T08:20:02Z) - A Large-Scale Evaluation of Speech Foundation Models [110.95827399522204]
音声処理ユニバーサルパフォーマンスベンチマーク(SUPERB)を構築し,基礎モデルパラダイムの有効性について検討する。
凍結基盤モデルを用いてSUPERBにおける音声処理タスクに対処する統合マルチタスクフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-15T00:03:16Z) - FLIP: Fine-grained Alignment between ID-based Models and Pretrained Language Models for CTR Prediction [49.510163437116645]
クリックスルーレート(CTR)予測は、パーソナライズされたオンラインサービスにおいてコア機能モジュールとして機能する。
CTR予測のための従来のIDベースのモデルは、表形式の1ホットエンコードされたID特徴を入力として取る。
事前訓練された言語モデル(PLM)は、テキストのモダリティの文を入力として取る別のパラダイムを生み出した。
本稿では,CTR予測のためのIDベースモデルと事前学習言語モデル(FLIP)間の細粒度特徴レベルのアライメントを提案する。
論文 参考訳(メタデータ) (2023-10-30T11:25:03Z) - Improving Aspect-Based Sentiment with End-to-End Semantic Role Labeling
Model [6.85316573653194]
本稿では,Aspect-Based Sentiment Analysis(ABSA)の性能向上を目的とした一連のアプローチを提案する。
本稿では,トランスフォーマーの隠蔽状態における構造的意味情報の大部分を効果的にキャプチャする,エンドツーエンドのセマンティックロールラベルモデルを提案する。
ELECTRA小モデルを用いて,提案したモデルを英語とチェコ語で評価した。
論文 参考訳(メタデータ) (2023-07-27T11:28:16Z) - Exploring Category Structure with Contextual Language Models and Lexical
Semantic Networks [0.0]
我々は、典型値の予測のために、CLMを探索するためのより広い範囲の手法を試験する。
BERTを用いた実験では,CLMプローブの適切な利用の重要性が示された。
その結果, この課題における多義性の重要性が浮き彫りとなった。
論文 参考訳(メタデータ) (2023-02-14T09:57:23Z) - Deploying a BERT-based Query-Title Relevance Classifier in a Production
System: a View from the Trenches [3.1219977244201056]
変換器(BERT)モデルによる双方向表現は,多くの自然言語処理(NLP)タスクの性能を大幅に向上させてきた。
BERTを低レイテンシ、高スループットの産業用ユースケースにスケールすることは、その巨大なサイズのために困難である。
BERT Bidirectional Long Short-Term Memory (BertBiLSTM) という名前のコンパクトモデルによるデプロイメントのためのQTR分類器の最適化に成功した。
BertBiLSTMは、上記の実世界の生産作業における精度と効率の観点から、既成のBERTモデルの性能を上回る
論文 参考訳(メタデータ) (2021-08-23T14:28:23Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Unsupervised Paraphrasing with Pretrained Language Models [85.03373221588707]
教師なし環境で,事前学習した言語モデルを用いて高品質なパラフレーズを生成する訓練パイプラインを提案する。
提案手法は,タスク適応,自己スーパービジョン,動的ブロッキング(Dynamic Blocking)という新しい復号アルゴリズムから構成される。
提案手法は,Quora Question PairとParaNMTの両方のデータセット上で,最先端の性能を達成できることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:55:28Z) - Cross-lingual Information Retrieval with BERT [8.052497255948046]
本稿では、人気のある双方向言語モデルBERTを用いて、英語クエリと外国語文書の関係をモデル化し、学習する。
BERTに基づく深部関係マッチングモデルを導入し,教師の弱い事前学習多言語BERTモデルを微調整して訓練する。
短い英語クエリに対するリトアニア語文書の検索実験の結果、我々のモデルは有効であり、競争ベースラインのアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-04-24T23:32:13Z) - Coreferential Reasoning Learning for Language Representation [88.14248323659267]
本稿では,コンテキスト内でコアファーデンシャル関係をキャプチャ可能な新しい言語表現モデルCorefBERTを提案する。
実験の結果,既存のベースラインモデルと比較して,CorefBERTは下流のNLPタスクにおいて一貫した大幅な改善を達成できることがわかった。
論文 参考訳(メタデータ) (2020-04-15T03:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。