論文の概要: An Ensemble Approach to Acronym Extraction using Transformers
- arxiv url: http://arxiv.org/abs/2201.03026v1
- Date: Sun, 9 Jan 2022 14:49:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-12 02:37:22.514179
- Title: An Ensemble Approach to Acronym Extraction using Transformers
- Title(参考訳): 変圧器を用いた頭字語抽出へのアンサンブルアプローチ
- Authors: Prashant Sharma, Hadeel Saadany, Leonardo Zilio, Diptesh Kanojia,
Constantin Or\u{a}san
- Abstract要約: 頭字語は、文中の句の初期成分を用いて構築された句の省略単位である。
本稿では,アクロニム抽出の課題に対するアンサンブルアプローチについて論じる。
- 参考スコア(独自算出の注目度): 7.88595796865485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Acronyms are abbreviated units of a phrase constructed by using initial
components of the phrase in a text. Automatic extraction of acronyms from a
text can help various Natural Language Processing tasks like machine
translation, information retrieval, and text summarisation. This paper
discusses an ensemble approach for the task of Acronym Extraction, which
utilises two different methods to extract acronyms and their corresponding long
forms. The first method utilises a multilingual contextual language model and
fine-tunes the model to perform the task. The second method relies on a
convolutional neural network architecture to extract acronyms and append them
to the output of the previous method. We also augment the official training
dataset with additional training samples extracted from several open-access
journals to help improve the task performance. Our dataset analysis also
highlights the noise within the current task dataset. Our approach achieves the
following macro-F1 scores on test data released with the task: Danish (0.74),
English-Legal (0.72), English-Scientific (0.73), French (0.63), Persian (0.57),
Spanish (0.65), Vietnamese (0.65). We release our code and models publicly.
- Abstract(参考訳): 頭字語は、文中の句の初期成分を用いて構築された句の省略単位である。
テキストからの頭字語の自動抽出は、機械翻訳、情報検索、テキスト要約といった様々な自然言語処理タスクに役立つ。
本稿では, 頭字語抽出の課題に対して, 2つの異なる手法を用いて頭字語とその長文の抽出を行うアンサンブル手法を提案する。
最初の方法は多言語文脈言語モデルを利用し、タスクを実行するためにモデルを微調整する。
第2の方法は畳み込みニューラルネットワークアーキテクチャを使って頭字語を抽出し、それらを前のメソッドの出力に追加する。
また、いくつかのオープンアクセスジャーナルから抽出した追加のトレーニングサンプルを用いて、公式のトレーニングデータセットも強化し、タスクパフォーマンスの向上に役立てます。
当社のデータセット分析では、現在のタスクデータセット内のノイズも強調しています。
デンマーク語 (0.74), 英語法 (0.72), 英語法 (0.73), 英語法 (0.73), フランス語 (0.63), ペルシア語 (0.57), スペイン語 (0.65), ベトナム語 (0.65) である。
コードとモデルを公開しています。
関連論文リスト
- A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Cross-lingual Contextualized Phrase Retrieval [63.80154430930898]
そこで本研究では,言語間関係の単語検索を多義的に行うタスクの定式化を提案する。
我々は、コントラスト学習を用いて、言語間コンテクスト対応句検索(CCPR)を訓練する。
フレーズ検索タスクでは、CCPRはベースラインをかなり上回り、少なくとも13ポイント高いトップ1の精度を達成する。
論文 参考訳(メタデータ) (2024-03-25T14:46:51Z) - Language and Task Arithmetic with Parameter-Efficient Layers for Zero-Shot Summarization [126.96113831681338]
本稿では,言語やタスク特化パラメータを構成することで,ゼロショットの言語間移動を改善することを提案する。
本手法は,言語とタスクPEFTモジュールを要素演算により構成し,ラベルなしデータと英語ラベル付きデータを活用する。
論文 参考訳(メタデータ) (2023-11-15T20:04:58Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - Training Naturalized Semantic Parsers with Very Little Data [10.709587018625275]
State-of-the-art(SOTA)セマンティクスは、大量のテキストに基づいて事前訓練された大規模な言語モデルに基づくセク2セックアーキテクチャである。
最近の研究は意味解析の改革を探求しており、出力シーケンスはそれ自体が自然言語文である。
本手法は,Overnightデータセット上で新たなSOTA数ショット性能を実現する。
論文 参考訳(メタデータ) (2022-04-29T17:14:54Z) - PLOD: An Abbreviation Detection Dataset for Scientific Documents [8.085950562565893]
PLODは、省略検出と抽出のための大規模なデータセットである。
略語と長い形で自動的に注釈付けされた160k以上のセグメントを含んでいる。
略語や長い形を検出するために,いくつかのベースラインモデルを生成する。
論文 参考訳(メタデータ) (2022-04-26T03:52:21Z) - PSG: Prompt-based Sequence Generation for Acronym Extraction [26.896811663334162]
頭字語抽出タスクのためのPrompt-based Sequence Generation (PSG) 手法を提案する。
具体的には、抽出した頭字語テキストを自動回帰でプロンプトするテンプレートを設計する。
生成した回答の位置を抽出する位置抽出アルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-11-29T02:14:38Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - MCL@IITK at SemEval-2021 Task 2: Multilingual and Cross-lingual
Word-in-Context Disambiguation using Augmented Data, Signals, and
Transformers [1.869621561196521]
我々はSemEval 2021 Task 2: Multilingual and cross-lingual Word-in-Context Disambiguation (MCL-WiC) の解法を提案する。
目的は、両方の文に共通する単語が同じ意味を引き起こすかどうかを検出することである。
多言語とクロスリンガルの両方の設定のためのシステムを提出します。
論文 参考訳(メタデータ) (2021-04-04T08:49:28Z) - Pre-training via Paraphrasing [96.79972492585112]
教師なし多言語パラフレージング目的を用いて学習した,事前学習されたシーケンス・ツー・シーケンスモデルであるMARGEを紹介する。
ランダムな初期化のみを前提として,検索と再構築を共同で行うことができることを示す。
例えば、追加のタスク固有のトレーニングがなければ、文書翻訳のBLEUスコアは最大35.8に達する。
論文 参考訳(メタデータ) (2020-06-26T14:43:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。