論文の概要: Decorate the Examples: A Simple Method of Prompt Design for Biomedical
Relation Extraction
- arxiv url: http://arxiv.org/abs/2204.10360v1
- Date: Thu, 21 Apr 2022 18:39:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-25 13:21:57.968507
- Title: Decorate the Examples: A Simple Method of Prompt Design for Biomedical
Relation Extraction
- Title(参考訳): 例をデコレートする: 生医学的関係抽出のための簡単なプロンプト設計法
- Authors: Hui-Syuan Yeh, Thomas Lavergne, Pierre Zweigenbaum
- Abstract要約: 本稿では,簡単なプロンプトの定式化の下で,関係抽出タスクをクローゼテストタスクとして再構成する包括的プロンプトを生成する手法を提案する。
BioMed-RoBERTa-baseでは,SciFive-Largeより14.21F1,SciFive-Largeより1.14F1を得ることができた。
- 参考スコア(独自算出の注目度): 5.4572790062292125
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Relation extraction is a core problem for natural language processing in the
biomedical domain. Recent research on relation extraction showed that
prompt-based learning improves the performance on both fine-tuning on full
training set and few-shot training. However, less effort has been made on
domain-specific tasks where good prompt design can be even harder. In this
paper, we investigate prompting for biomedical relation extraction, with
experiments on the ChemProt dataset. We present a simple yet effective method
to systematically generate comprehensive prompts that reformulate the relation
extraction task as a cloze-test task under a simple prompt formulation. In
particular, we experiment with different ranking scores for prompt selection.
With BioMed-RoBERTa-base, our results show that prompting-based fine-tuning
obtains gains by 14.21 F1 over its regular fine-tuning baseline, and 1.14 F1
over SciFive-Large, the current state-of-the-art on ChemProt. Besides, we find
prompt-based learning requires fewer training examples to make reasonable
predictions. The results demonstrate the potential of our methods in such a
domain-specific relation extraction task.
- Abstract(参考訳): 関連抽出は、生物医学領域における自然言語処理の核となる問題である。
関係抽出に関する最近の研究は、素早い学習がフルトレーニングセットと少数ショットトレーニングの両方における微調整の性能を向上させることを示した。
しかし、優れたプロンプト設計が難しいドメイン固有のタスクに対する労力は少なくなっている。
本稿では,ChemProtデータセットを用いたバイオメディカルな関係抽出の促進について検討する。
本稿では,関係抽出タスクを単純なプロンプト定式化の下でクローズテストタスクとして再編成する包括的プロンプトを体系的に生成する,単純かつ効果的な手法を提案する。
特に,迅速な選択のために,異なるランキングスコアを試す。
BioMed-RoBERTa-baseでは,通常の微調整ベースラインで14.21F1,ChemProtで現在最先端のSciFive-Largeで1.14F1を得ることができた。
さらに、プロンプトベースの学習では、合理的な予測を行うためのトレーニングサンプルが少なくなることも分かりました。
その結果,ドメイン固有の関係抽出タスクにおける手法の可能性を示した。
関連論文リスト
- Closed-Form Test Functions for Biophysical Sequence Optimization Algorithms [35.95872277958525]
生物物理シーケンス最適化のための新しい閉形式テスト関数のクラスを提案し、このクラスをEhrlich関数と呼ぶ。
これらの機能は研究の興味深い対象であり、標準的な遺伝的最適化ベースラインで解決するのは簡単ではないことを示す実証的な結果を提供する。
論文 参考訳(メタデータ) (2024-06-28T21:13:57Z) - BioREx: Improving Biomedical Relation Extraction by Leveraging
Heterogeneous Datasets [7.7587371896752595]
生物医学的関係抽出(RE)は、生物医学的自然言語処理(NLP)研究における中心的な課題である。
本稿では、個々のデータセットのデータの均一性を体系的に解決し、それらを大きなデータセットに組み合わせるための新しいフレームワークを提案する。
評価の結果,BioRExは個々のデータセットでトレーニングしたベンチマークシステムよりも大幅に高い性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-06-19T22:48:18Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - An Empirical Study on Relation Extraction in the Biomedical Domain [0.0]
文レベルの関係抽出と文書レベルの関係抽出について検討し、いくつかのベンチマークデータセット上で最先端の手法を実行する。
以上の結果から,(1)現行の文書レベルの関係抽出手法は高い一般化能力を有し,(2)既存の手法では,バイオメディシンのモデル微調整に大量のラベル付きデータを必要とすることがわかった。
論文 参考訳(メタデータ) (2021-12-11T03:36:38Z) - BioIE: Biomedical Information Extraction with Multi-head Attention
Enhanced Graph Convolutional Network [9.227487525657901]
本稿では,バイオメディカルテキストと非構造化医療報告から関係を抽出するハイブリッドニューラルネットワークであるバイオメディカル情報抽出を提案する。
本研究は,2つの主要な生医学的関係抽出タスク,化学物質とタンパク質の相互作用,およびクロスホスピタル・パン・カンノロジー報告コーパスについて検討した。
論文 参考訳(メタデータ) (2021-10-26T13:19:28Z) - Slot Filling for Biomedical Information Extraction [0.5330240017302619]
バイオメディカルIEの課題に対してスロットフィリングアプローチを提案する。
我々は、トランフォーマベースのバイエンコーダDense Passage RetrievalをTransformerベースのリーダーモデルと結合する提案パラダイムに従う。
論文 参考訳(メタデータ) (2021-09-17T14:16:00Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - BUSTLE: Bottom-Up Program Synthesis Through Learning-Guided Exploration [72.88493072196094]
プログラムのボトムアップ検索に学習を活用する新しい合成手法を提案する。
特に、入力出力例のセットに基づいて、探索条件中の中間値の合成を優先順位付けするようにモデルを訓練する。
単純な教師付き学習アプローチであっても,学習とボトムアップ検索の組み合わせは極めて効果的であることを示す。
論文 参考訳(メタデータ) (2020-07-28T17:46:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。