論文の概要: BIOMRC: A Dataset for Biomedical Machine Reading Comprehension
- arxiv url: http://arxiv.org/abs/2005.06376v1
- Date: Wed, 13 May 2020 15:38:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 09:56:42.565465
- Title: BIOMRC: A Dataset for Biomedical Machine Reading Comprehension
- Title(参考訳): BIOMRC: バイオメディカルマシン読解のためのデータセット
- Authors: Petros Stavropoulos, Dimitris Pappas, Ion Androutsopoulos, Ryan
McDonald
- Abstract要約: 本稿では,大規模閉鎖型バイオメディカルMRCデータセットであるBIOMRCを紹介する。
前回のBIIOREADデータセットと比較して、ノイズを低減するために注意が払われた。
BIOREADと比較して、新しいデータセットでは非専門家の人的パフォーマンスが高い。
- 参考スコア(独自算出の注目度): 20.67289116848587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce BIOMRC, a large-scale cloze-style biomedical MRC dataset. Care
was taken to reduce noise, compared to the previous BIOREAD dataset of Pappas
et al. (2018). Experiments show that simple heuristics do not perform well on
the new dataset, and that two neural MRC models that had been tested on BIOREAD
perform much better on BIOMRC, indicating that the new dataset is indeed less
noisy or at least that its task is more feasible. Non-expert human performance
is also higher on the new dataset compared to BIOREAD, and biomedical experts
perform even better. We also introduce a new BERT-based MRC model, the best
version of which substantially outperforms all other methods tested, reaching
or surpassing the accuracy of biomedical experts in some experiments. We make
the new dataset available in three different sizes, also releasing our code,
and providing a leaderboard.
- Abstract(参考訳): 本稿では,大規模閉鎖型バイオメディカルMRCデータセットであるBIOMRCを紹介する。
Pappas et al. (2018) の以前のBIIOREADデータセットと比較して、ノイズを減らすために注意が払われた。
実験の結果、単純なヒューリスティックスは新たなデータセットではうまく機能せず、BIOREADでテストされた2つのニューラルMCCモデルは、BIOMRCでははるかに良く機能し、新しいデータセットが実際にノイズが少ないか、少なくともそのタスクがより実現可能であることを示している。
新たなデータセットでは、BIOREADよりも非専門家の人的パフォーマンスが向上し、バイオメディカルの専門家のパフォーマンスはさらに向上した。
また,新たなBERTベースのMRCモデルも導入し,試験対象の他の方法よりもはるかに優れており,バイオメディカル専門家の精度を上回っている。
新しいデータセットを3つの異なるサイズで提供し、コードもリリースし、リーダボードを提供しています。
関連論文リスト
- Phikon-v2, A large and public feature extractor for biomarker prediction [42.52549987351643]
我々は、DINOv2を用いて視覚変換器を訓練し、このモデルの1つのイテレーションを公開して、Phikon-v2と呼ばれるさらなる実験を行う。
Phikon-v2は、公開されている組織学のスライドをトレーニングしながら、以前リリースしたモデル(Phikon)を上回り、プロプライエタリなデータでトレーニングされた他の病理学基盤モデル(FM)と同等に動作します。
論文 参考訳(メタデータ) (2024-09-13T20:12:29Z) - Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.24726622142558]
$k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-12-15T14:04:23Z) - Towards More Practical Group Activity Detection: A New Benchmark and Model [61.39427407758131]
グループアクティビティ検出(グループアクティビティ検出、英: Group Activity Detection、GAD)は、ビデオにおいて、各グループのメンバを特定し、同時にグループのアクティビティを分類するタスクである。
私たちはCaf'eと呼ばれる新しいデータセットを提示し、より実用的なシナリオとメトリクスを提示します。
また、未知数のグループと潜在グループメンバーを効率的に効率的に扱う新しいGADモデルを提案する。
論文 参考訳(メタデータ) (2023-12-05T16:48:17Z) - BioREx: Improving Biomedical Relation Extraction by Leveraging
Heterogeneous Datasets [7.7587371896752595]
生物医学的関係抽出(RE)は、生物医学的自然言語処理(NLP)研究における中心的な課題である。
本稿では、個々のデータセットのデータの均一性を体系的に解決し、それらを大きなデータセットに組み合わせるための新しいフレームワークを提案する。
評価の結果,BioRExは個々のデータセットでトレーニングしたベンチマークシステムよりも大幅に高い性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-06-19T22:48:18Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Which Student is Best? A Comprehensive Knowledge Distillation Exam for
Task-Specific BERT Models [3.303435360096988]
タスク固有のBERTベースの教師モデルから様々な学生モデルへの知識蒸留ベンチマークを行う。
インドネシア語でテキスト分類とシークエンスラベリングという2つのタスクでグループ化された12のデータセットについて実験を行った。
実験の結果, トランスフォーマーモデルの普及にもかかわらず, BiLSTM と CNN の学生モデルを用いることで, 性能と計算資源の最良のトレードオフが得られることがわかった。
論文 参考訳(メタデータ) (2022-01-03T10:07:13Z) - CLMB: deep contrastive learning for robust metagenomic binning [10.076298003343652]
メタゲノム結合(CLMB)のための深層コントラスト学習フレームワークを提案する。
効率よくノイズの乱れを排除し、より安定で堅牢な結果を生み出すことができる。
CLMBは従来の最先端のバイナリ手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2021-11-18T12:26:02Z) - Deep neural networks approach to microbial colony detection -- a
comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。
得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文 参考訳(メタデータ) (2021-08-23T12:06:00Z) - Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。
Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。
また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文 参考訳(メタデータ) (2021-06-01T22:33:53Z) - Investigation of BERT Model on Biomedical Relation Extraction Based on
Revised Fine-tuning Mechanism [2.8881198461098894]
BERTモデルの微調整過程における層全体の利用法について検討する。
さらに解析により,BERTモデルの最後の層から関係性に関する重要な知識を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-11-01T01:47:16Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。