論文の概要: BioADAPT-MRC: Adversarial Learning-based Domain Adaptation Improves
Biomedical Machine Reading Comprehension Task
- arxiv url: http://arxiv.org/abs/2202.13174v1
- Date: Sat, 26 Feb 2022 16:14:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 13:33:13.639789
- Title: BioADAPT-MRC: Adversarial Learning-based Domain Adaptation Improves
Biomedical Machine Reading Comprehension Task
- Title(参考訳): BioADAPT-MRC: 逆学習に基づくドメイン適応によるバイオメディカル機械読解作業の改善
- Authors: Maria Mahbub, Sudarshan Srinivasan, Edmon Begoli and Gregory D
Peterson
- Abstract要約: 本稿では,生物医学機械読解作業のための逆学習に基づくドメイン適応フレームワークを提案する。
BioADAPT-MRCは、一般的なドメインデータセットとバイオメディカルドメインデータセットの間の限界分布の相違に対処するニューラルネットワークベースの手法である。
- 参考スコア(独自算出の注目度): 4.837365865245979
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Motivation: Biomedical machine reading comprehension (biomedical-MRC) aims to
comprehend complex biomedical narratives and assist healthcare professionals in
retrieving information from them. The high performance of modern neural
network-based MRC systems depends on high-quality, large-scale, human-annotated
training datasets. In the biomedical domain, a crucial challenge in creating
such datasets is the requirement for domain knowledge, inducing the scarcity of
labeled data and the need for transfer learning from the labeled
general-purpose (source) domain to the biomedical (target) domain. However,
there is a discrepancy in marginal distributions between the general-purpose
and biomedical domains due to the variances in topics. Therefore,
direct-transferring of learned representations from a model trained on a
general-purpose domain to the biomedical domain can hurt the model's
performance.
Results: We present an adversarial learning-based domain adaptation framework
for the biomedical machine reading comprehension task (BioADAPT-MRC), a neural
network-based method to address the discrepancies in the marginal distributions
between the general and biomedical domain datasets. BioADAPT-MRC relaxes the
need for generating pseudo labels for training a well-performing biomedical-MRC
model. We extensively evaluate the performance of BioADAPT-MRC by comparing it
with the best existing methods on three widely used benchmark biomedical-MRC
datasets -- BioASQ-7b, BioASQ-8b, and BioASQ-9b. Our results suggest that
without using any synthetic or human-annotated data from the biomedical domain,
BioADAPT-MRC can achieve state-of-the-art performance on these datasets.
Availability: BioADAPT-MRC is freely available as an open-source project
at\\https://github.com/mmahbub/BioADAPT-MRC
- Abstract(参考訳): モチベーション:バイオメディカルマシンリーディング理解(biomedical machine reading comprehension:biomedical-mrc)は、複雑なバイオメディカルナラティブを理解し、医療専門家が情報を取得するのを助けることを目的としている。
現代のニューラルネットワークベースのMRCシステムの高性能は、高品質で大規模で人間の注釈付きトレーニングデータセットに依存している。
バイオメディカル領域では、このようなデータセットを作成する上で重要な課題は、ラベル付きデータの不足とラベル付き汎用(ソース)ドメインからバイオメディカル(ターゲット)ドメインへの転送学習の必要性を誘発する、ドメイン知識の要件である。
しかし、トピックのばらつきにより、汎用ドメインとバイオメディカルドメインの間には限界分布に差がある。
したがって、汎用ドメインで訓練されたモデルからバイオメディカルドメインへの学習表現の直接転送は、モデルの性能を損なう可能性がある。
結果: 一般と生物医学領域のデータセット間の限界分布の相違に対処するニューラルネットワークベースの手法であるbioadapt-mrc(biomedical machine reading comprehension task)のための,敵対的学習に基づくドメイン適応フレームワークを提案する。
BioADAPT-MRCは、優れたバイオメディカル-MRCモデルのトレーニングのために擬似ラベルを生成する必要性を緩和する。
そこで我々は,BioASQ-7b,BioASQ-8b,BioASQ-9bの3つのベンチマークMRCデータセットを用いて,BioADAPT-MRCの性能評価を行った。
以上の結果から,生体医学領域からの合成データや人間の注釈データを用いなければ,bioadapt-mrcはこれらのデータセットで最先端のパフォーマンスを達成できることが示唆された。
可用性: BioADAPT-MRC は https://github.com/mmahbub/BioADAPT-MRC でオープンソースプロジェクトとして無償公開されている。
関連論文リスト
- BioMNER: A Dataset for Biomedical Method Entity Recognition [25.403593761614424]
本稿では,生物医学的手法による実体認識のための新しいデータセットを提案する。
我々は、人間のアノテーションを支援するために、自動的なBioMethodエンティティ認識と情報検索システムを採用している。
実験の結果,言語モデルのパラメータ数が大きくなると,実体抽出パターンの有効同化が著しく阻害されることが判明した。
論文 参考訳(メタデータ) (2024-06-28T16:34:24Z) - Augmenting Biomedical Named Entity Recognition with General-domain Resources [47.24727904076347]
ニューラルネットワークに基づくバイオメディカル名前付きエンティティ認識(BioNER)モデルのトレーニングは通常、広範囲でコストのかかる人的アノテーションを必要とする。
GERBERAは、一般ドメインのNERデータセットをトレーニングに利用した、単純なyet効率の手法である。
我々は,81,410インスタンスからなる8つのエンティティタイプの5つのデータセットに対して,GERBERAを体系的に評価した。
論文 参考訳(メタデータ) (2024-06-15T15:28:02Z) - BMRetriever: Tuning Large Language Models as Better Biomedical Text Retrievers [48.21255861863282]
BMRetrieverは、バイオメディカル検索を強化するための一連の密集したレトリバーである。
BMRetrieverは強力なパラメータ効率を示し、410Mの派生型はベースラインを最大11.7倍まで上回っている。
論文 参考訳(メタデータ) (2024-04-29T05:40:08Z) - LLMs in Biomedicine: A study on clinical Named Entity Recognition [42.71263594812782]
大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な汎用性を示す。
本稿では,NERタスクの性能向上戦略について検討する。
提案手法であるDiRAGは,バイオメディカルNERにおけるLDMのゼロショットF1スコアを高めることができる。
論文 参考訳(メタデータ) (2024-04-10T22:26:26Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Multi-level biomedical NER through multi-granularity embeddings and
enhanced labeling [3.8599767910528917]
本稿では,複数のモデルの強みを統合するハイブリッドアプローチを提案する。
BERTは、文脈化された単語の埋め込み、文字レベルの情報キャプチャのための事前訓練されたマルチチャネルCNN、およびテキスト内の単語間の依存関係のシーケンスラベリングとモデル化のためのBiLSTM + CRFを提供する。
我々は、ベンチマークi2b2/2010データセットを用いて、F1スコア90.11を達成する。
論文 参考訳(メタデータ) (2023-12-24T21:45:36Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - BioALBERT: A Simple and Effective Pre-trained Language Model for
Biomedical Named Entity Recognition [9.05154470433578]
既存のBioNERアプローチはこれらの問題を無視し、最先端(SOTA)モデルを直接採用することが多い。
本稿では,大規模バイオメディカルコーパスを用いた効果的なドメイン固有言語モデルであるALBERTを提案する。
論文 参考訳(メタデータ) (2020-09-19T12:58:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。