論文の概要: Probing for Understanding of English Verb Classes and Alternations in
Large Pre-trained Language Models
- arxiv url: http://arxiv.org/abs/2209.04811v1
- Date: Sun, 11 Sep 2022 08:04:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 12:55:34.631109
- Title: Probing for Understanding of English Verb Classes and Alternations in
Large Pre-trained Language Models
- Title(参考訳): 大規模事前学習型言語モデルにおける英語動詞のクラスと交代の理解
- Authors: David K. Yi, James V. Bruno, Jiayu Han, Peter Zukerman, Shane
Steinert-Threlkeld
- Abstract要約: 本研究では,大規模事前学習言語モデルの埋め込みにおいて,動詞の交替クラスがエンコードされる範囲について検討する。
PLMのコンテキスト埋め込みは、多くのクラスにおけるタスクに対する驚くほど高い精度を実現する。
- 参考スコア(独自算出の注目度): 4.243426191555036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate the extent to which verb alternation classes, as described by
Levin (1993), are encoded in the embeddings of Large Pre-trained Language
Models (PLMs) such as BERT, RoBERTa, ELECTRA, and DeBERTa using selectively
constructed diagnostic classifiers for word and sentence-level prediction
tasks. We follow and expand upon the experiments of Kann et al. (2019), which
aim to probe whether static embeddings encode frame-selectional properties of
verbs. At both the word and sentence level, we find that contextual embeddings
from PLMs not only outperform non-contextual embeddings, but achieve
astonishingly high accuracies on tasks across most alternation classes.
Additionally, we find evidence that the middle-to-upper layers of PLMs achieve
better performance on average than the lower layers across all probing tasks.
- Abstract(参考訳): Levin (1993) が記述した動詞交替クラスが BERT, RoBERTa, ELECTRA, DeBERTa などの大規模事前学習言語モデル (PLM) の埋め込みにおいて,単語・文レベルの予測タスクを選択的に構築した診断分類器を用いてエンコードされている範囲について検討する。
我々は、静的埋め込みが動詞のフレーム選択特性を符号化するかどうかを調査することを目的としたKann et al. (2019) の実験に従い、拡張する。
単語と文のレベルでは、PLMの文脈埋め込みは、非文脈埋め込みよりも優れているだけでなく、ほとんどの交替クラスにおけるタスクに対する驚くほど高い精度を達成する。
さらに、PLMの中間層が全ての探索タスクの下位層よりも平均して優れた性能を発揮することを示す。
関連論文リスト
- Data-Augmentation-Based Dialectal Adaptation for LLMs [26.72394783468532]
本稿では, GMUNLPによるVarDial 2024におけるDialect-Copa共有タスクへの参加について述べる。
この課題は、南スラヴ語のマイクロディレクト上での大規模言語モデル(LLM)の常識推論能力を評価することに焦点を当てている。
本稿では,異なるタイプの言語モデルの強みを組み合わせ,データ拡張技術を活用してタスク性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2024-04-11T19:15:32Z) - MoSECroT: Model Stitching with Static Word Embeddings for Crosslingual Zero-shot Transfer [50.40191599304911]
クロスリンガルゼロショット転送のための静的単語埋め込みを用いたMoSECroTモデルスティッチについて紹介する。
本稿では,ソースコードPLMの埋め込みと対象言語の静的単語埋め込みのための共通空間を構築するために,相対表現を利用した最初のフレームワークを提案する。
提案するフレームワークは,MoSECroTに対処する際,弱いベースラインと競合するが,強いベースラインに比べて競合する結果が得られないことを示す。
論文 参考訳(メタデータ) (2024-01-09T21:09:07Z) - LLM-augmented Preference Learning from Natural Language [19.700169351688768]
大規模言語モデル(LLM)は、より大きな文脈長を扱う。
LLM は、ターゲットテキストが大きければ SotA を一貫して上回る。
ゼロショット学習よりもパフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-10-12T17:17:27Z) - Exploring Category Structure with Contextual Language Models and Lexical
Semantic Networks [0.0]
我々は、典型値の予測のために、CLMを探索するためのより広い範囲の手法を試験する。
BERTを用いた実験では,CLMプローブの適切な利用の重要性が示された。
その結果, この課題における多義性の重要性が浮き彫りとなった。
論文 参考訳(メタデータ) (2023-02-14T09:57:23Z) - Language Model Pre-Training with Sparse Latent Typing [66.75786739499604]
そこで本研究では,多種多様な潜在型を持つ文レベルのキーワードを疎に抽出することのできる,事前学習対象Sparse Latent Typingを提案する。
実験結果から,本モデルは外部知識を使わずに,自己教師型で解釈可能な潜在型カテゴリを学習できることが示唆された。
論文 参考訳(メタデータ) (2022-10-23T00:37:08Z) - Don't Judge a Language Model by Its Last Layer: Contrastive Learning
with Layer-Wise Attention Pooling [6.501126898523172]
近年の事前学習型言語モデル (PLM) は, 言語的特徴や文脈化文表現の学習を通じて, 多くの自然言語処理タスクにおいて大きな成功を収めている。
本稿では,各層に捕えられたレイヤワイド信号をモデルで保存し,下流タスクの消化言語的特徴を学習する,アテンションベースのプーリング戦略を提案する。
論文 参考訳(メタデータ) (2022-09-13T13:09:49Z) - Better Language Model with Hypernym Class Prediction [101.8517004687825]
クラスベース言語モデル (LM) は、コンテキストの疎結合に$n$-gramのLMで対処するために長年開発されてきた。
本研究では,このアプローチをニューラルLMの文脈で再考する。
論文 参考訳(メタデータ) (2022-03-21T01:16:44Z) - SLM: Learning a Discourse Language Representation with Sentence
Unshuffling [53.42814722621715]
談話言語表現を学習するための新しい事前学習目的である文レベル言語モデリングを導入する。
本モデルでは,この特徴により,従来のBERTの性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-10-30T13:33:41Z) - Explicit Alignment Objectives for Multilingual Bidirectional Encoders [111.65322283420805]
本稿では,多言語エンコーダAMBER(Aligned Multilingual Bi-directional EncodeR)の学習方法を提案する。
AMBERは、異なる粒度で多言語表現を整列する2つの明示的なアライメント目標を使用して、追加の並列データに基づいて訓練される。
実験結果から、AMBERは、シーケンスタグ付けで1.1平均F1スコア、XLMR-大規模モデル上での検索で27.3平均精度を得ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T18:34:13Z) - Toward Better Storylines with Sentence-Level Language Models [54.91921545103256]
本稿では,文章中の次の文を選択する文レベル言語モデルを提案する。
教師なしストーリークローゼタスクにおける最先端の精度によるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-05-11T16:54:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。