論文の概要: DARE: Data Augmented Relation Extraction with GPT-2
- arxiv url: http://arxiv.org/abs/2004.13845v1
- Date: Mon, 6 Apr 2020 14:38:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:15:37.508727
- Title: DARE: Data Augmented Relation Extraction with GPT-2
- Title(参考訳): DARE:GPT-2を用いたデータ拡張関係抽出
- Authors: Yannis Papanikolaou and Andrea Pierleoni
- Abstract要約: 本稿では,データ拡張関係抽出(DARE, Data Augmented Relation extract)を提案する。
DAREは、3つの広く使われているバイオメディカルREデータセットにおいて、前回の結果を平均4.7F1ポイント上回った。
- 参考スコア(独自算出の注目度): 0.26651200086513094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world Relation Extraction (RE) tasks are challenging to deal with,
either due to limited training data or class imbalance issues. In this work, we
present Data Augmented Relation Extraction(DARE), a simple method to augment
training data by properly fine-tuning GPT-2 to generate examples for specific
relation types. The generated training data is then used in combination with
the gold dataset to train a BERT-based RE classifier. In a series of
experiments we show the advantages of our method, which leads in improvements
of up to 11 F1 score points against a strong base-line. Also, DARE achieves new
state of the art in three widely used biomedical RE datasets surpassing the
previous best results by 4.7 F1 points on average.
- Abstract(参考訳): 実世界の関係抽出(RE)タスクは、限られたトレーニングデータやクラス不均衡の問題のために扱いにくい。
本稿では、gpt-2を適切に微調整し、特定の関係型の例を生成することにより、トレーニングデータを強化する簡易な方法であるdata augmented relation extraction(dare)を提案する。
生成されたトレーニングデータは、金のデータセットと組み合わせてBERTベースのRE分類器をトレーニングする。
一連の実験において,本手法の利点が示され,F1スコアを最大11点向上させることができた。
また、DAREは3つの広く使われているバイオメディカルREデータセットにおいて、前回の結果を平均4.7F1ポイント上回っている。
関連論文リスト
- Generative Pre-Trained Transformer for Symbolic Regression Base In-Context Reinforcement Learning [12.660401635672967]
観測データから数学的公式を見つけることは、科学研究の大きな要求である。
フォーミュラGPTは4つのベースラインと比較して適合性において最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-04-09T14:08:47Z) - On Evaluation Protocols for Data Augmentation in a Limited Data Scenario [11.09784120582206]
古典的なデータ拡張(文を修飾する)は、単により優れた微調整を行う方法であることを示す。
さらに,ChatGPT や LLama2 のような対話型エージェントによるゼロショットDAでは,性能が向上することを示した。
論文 参考訳(メタデータ) (2024-02-22T16:42:37Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Data Augmentation for Traffic Classification [54.92823760790628]
Data Augmentation (DA) はコンピュータビジョン(CV)と自然言語処理(NLP)に広く採用されている技術である。
DAはネットワークのコンテキスト、特にトラフィック分類(TC)タスクにおいて、牽引力を得るのに苦労しています。
論文 参考訳(メタデータ) (2024-01-19T15:25:09Z) - Noisy Self-Training with Synthetic Queries for Dense Retrieval [49.49928764695172]
合成クエリと組み合わせた,ノイズの多い自己学習フレームワークを提案する。
実験結果から,本手法は既存手法よりも一貫した改善が得られた。
我々の手法はデータ効率が良く、競争のベースラインより優れています。
論文 参考訳(メタデータ) (2023-11-27T06:19:50Z) - Efficient Grammatical Error Correction Via Multi-Task Training and
Optimized Training Schedule [55.08778142798106]
原文と修正文のアライメントを利用する補助タスクを提案する。
我々は,各タスクをシーケンス・ツー・シーケンス問題として定式化し,マルチタスク・トレーニングを行う。
トレーニングに使用されるデータセットの順序や、データセット内の個々のインスタンスでさえ、最終的なパフォーマンスに重要な影響を与える可能性があることが分かりました。
論文 参考訳(メタデータ) (2023-11-20T14:50:12Z) - RoPDA: Robust Prompt-based Data Augmentation for Low-Resource Named
Entity Recognition [10.03246698225533]
低リソースNERのためのロバストプロンプトベースデータ拡張(RoPDA)
継続的なプロンプトを持つ事前学習言語モデル(PLM)に基づいて、RoPDAはエンティティ拡張とコンテキスト拡張を実行する。
異なるドメインの3つのベンチマークの実験では、RoPDAは強いベースラインで大幅に改善されている。
論文 参考訳(メタデータ) (2023-07-11T14:44:14Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z) - Data Weighted Training Strategies for Grammatical Error Correction [8.370770440898454]
文法的誤り訂正(GEC)のトレーニングスケジュールにデルタ-log-perplexityを組み込む方法を示す。
得られたデータに基づいて訓練されたモデルは、一般的なGECテストセットで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-08-07T03:30:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。