論文の概要: EPICURE Ensemble Pretrained Models for Extracting Cancer Mutations from
Literature
- arxiv url: http://arxiv.org/abs/2106.07722v1
- Date: Fri, 11 Jun 2021 09:08:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 04:20:07.454018
- Title: EPICURE Ensemble Pretrained Models for Extracting Cancer Mutations from
Literature
- Title(参考訳): EPICURE Ensembleed Models for Extracting Cancer Mutations from Literature
- Authors: Jiarun Cao, Elke M van Veen, Niels Peek, Andrew G Renehan, Sophia
Ananiadou
- Abstract要約: EPICUREは、条件付きランダムフィールドパターン層とスパン予測パターン層を備え、テキストからがんの突然変異を抽出するアンサンブル事前訓練モデルである。
3つのベンチマークデータセットの実験結果から,ベースラインモデルと比較して競争力のある結果が得られた。
- 参考スコア(独自算出の注目度): 12.620782629498814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To interpret the genetic profile present in a patient sample, it is necessary
to know which mutations have important roles in the development of the
corresponding cancer type. Named entity recognition is a core step in the text
mining pipeline which facilitates mining valuable cancer information from the
scientific literature. However, due to the scarcity of related datasets,
previous NER attempts in this domain either suffer from low performance when
deep learning based models are deployed, or they apply feature based machine
learning models or rule based models to tackle this problem, which requires
intensive efforts from domain experts, and limit the model generalization
capability. In this paper, we propose EPICURE, an ensemble pre trained model
equipped with a conditional random field pattern layer and a span prediction
pattern layer to extract cancer mutations from text. We also adopt a data
augmentation strategy to expand our training set from multiple datasets.
Experimental results on three benchmark datasets show competitive results
compared to the baseline models.
- Abstract(参考訳): 患者サンプルに存在する遺伝子プロファイルを解釈するためには、どの変異が対応するがんタイプの発症に重要な役割を果たすかを知る必要がある。
名前付きエンティティ認識は、科学文献から貴重ながん情報をマイニングするためのテキストマイニングパイプラインの中核的なステップである。
しかし、関連するデータセットが不足しているため、この領域での以前のNERの試みは、ディープラーニングベースのモデルがデプロイされた場合の低パフォーマンスに悩まされるか、あるいは、この機能ベースの機械学習モデルやルールベースのモデルを適用してこの問題に対処する。
本稿では,条件付きランダムフィールドパターン層とスパン予測パターン層を備えたアンサンブル事前訓練モデルであるEPICUREを提案し,テキストから癌突然変異を抽出する。
また、複数のデータセットからトレーニングセットを拡張するために、データ拡張戦略を採用しています。
3つのベンチマークデータセットの実験結果は,ベースラインモデルと比較して競争力のある結果を示した。
関連論文リスト
- PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Exploration of the Rashomon Set Assists Trustworthy Explanations for
Medical Data [4.499833362998488]
本稿では,Rashomon集合におけるモデル探索の新たなプロセスを紹介し,従来のモデリング手法を拡張した。
動作の異なるモデルを検出するために,$textttRashomon_DETECT$アルゴリズムを提案する。
モデル間の変動効果の差を定量化するために,機能的データ解析に基づくプロファイル分散指数(PDI)を導入する。
論文 参考訳(メタデータ) (2023-08-22T13:53:43Z) - Incorporating Prior Knowledge in Deep Learning Models via Pathway
Activity Autoencoders [5.950889585409067]
本稿では,癌におけるRNA-seqデータのための,事前知識に基づく新しいディープオートエンコーディングフレームワークPAAEを提案する。
機能セットが小さいにもかかわらず,PAAEモデルとPAAEモデルでは,一般的な手法と比較して,アウト・オブ・セットの再現性が向上していることを示す。
論文 参考訳(メタデータ) (2023-06-09T11:12:55Z) - Graph Neural Networks for Breast Cancer Data Integration [0.0]
本稿では,ガンデータモダリティをグラフとして統合し,次にグラフニューラルネットワークを適用する3つのステップからなる新しい学習パイプラインを提案する。
このプロジェクトは、がんデータ理解を改善する可能性があり、正規データセットからグラフ型データへの移行を促進する。
論文 参考訳(メタデータ) (2022-11-28T17:10:19Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Multi-task fusion for improving mammography screening data
classification [3.7683182861690843]
まず、個別のタスク固有のモデルのセットをトレーニングするパイプラインアプローチを提案する。
次に、標準モデルの集合戦略とは対照的に、その融合について検討する。
我々の融合アプローチは、標準モデルのアンサンブルに比べてAUCのスコアを最大0.04向上させる。
論文 参考訳(メタデータ) (2021-12-01T13:56:27Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。