論文の概要: High-throughput relation extraction algorithm development associating
knowledge articles and electronic health records
- arxiv url: http://arxiv.org/abs/2009.03506v1
- Date: Tue, 8 Sep 2020 03:48:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 20:36:01.229592
- Title: High-throughput relation extraction algorithm development associating
knowledge articles and electronic health records
- Title(参考訳): 高スループット関係抽出アルゴリズムの開発 : 知識記事と電子健康記録の関連
- Authors: Yucong Lin, Keming Lu, Yulin Chen, Chuan Hong, Sheng Yu
- Abstract要約: 本稿では,ハイスループット関係抽出アルゴリズム開発のためのフレームワークであるHi-RESを提案する。
知識記事と電子健康記録を組み合わせることで,分類精度が著しく向上することを示す。
- 参考スコア(独自算出の注目度): 6.137500421118825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: Medical relations are the core components of medical knowledge
graphs that are needed for healthcare artificial intelligence. However, the
requirement of expert annotation by conventional algorithm development
processes creates a major bottleneck for mining new relations. In this paper,
we present Hi-RES, a framework for high-throughput relation extraction
algorithm development. We also show that combining knowledge articles with
electronic health records (EHRs) significantly increases the classification
accuracy. Methods: We use relation triplets obtained from structured databases
and semistructured webpages to label sentences from target corpora as positive
training samples. Two methods are also provided for creating improved negative
samples by combining positive samples with na\"ive negative samples. We propose
a common model that summarizes sentence information using large-scale
pretrained language models and multi-instance attention, which then joins with
the concept embeddings trained from the EHRs for relation prediction. Results:
We apply the Hi-RES framework to develop classification algorithms for
disorder-disorder relations and disorder-location relations. Millions of
sentences are created as training data. Using pretrained language models and
EHR-based embeddings individually provides considerable accuracy increases over
those of previous models. Joining them together further tremendously increases
the accuracy to 0.947 and 0.998 for the two sets of relations, respectively,
which are 10-17 percentage points higher than those of previous models.
Conclusion: Hi-RES is an efficient framework for achieving high-throughput and
accurate relation extraction algorithm development.
- Abstract(参考訳): 目的:医療関係は、医療人工知能に必要な医療知識グラフの中核的な構成要素である。
しかし、従来のアルゴリズム開発プロセスによる専門家アノテーションの要求は、新しい関係をマイニングするための大きなボトルネックを生み出している。
本稿では,ハイスループット関係抽出アルゴリズム開発のためのフレームワークであるhi-resを提案する。
また,知識項目と電子健康記録(EHR)を組み合わせることで,分類精度が著しく向上することを示した。
方法: 対象コーパスからの文を正のトレーニングサンプルとしてラベル付けするために, 構造化データベースと半構造化Webページから得られた関係トリプレットを用いる。
また、正のサンプルと「陰性」のサンプルを組み合わせることにより、改善された負のサンプルを作成するための2つの方法も提供される。
本稿では,大規模事前学習された言語モデルとマルチインテンス・アテンションを用いて文情報を要約する共通モデルを提案する。
結果: hi-resフレームワークを応用して,障害-不規則関係と障害-位置関係の分類アルゴリズムを開発した。
数百万の文がトレーニングデータとして作成されます。
事前訓練された言語モデルとEHRベースの埋め込みを使用することで、以前のモデルよりもかなり精度が向上する。
それらを結合することで、それぞれ前のモデルよりも10~17ポイント高い2つの関係集合に対して0.947と0.998の精度が大幅に向上する。
結論: Hi-RES は高スループットかつ高精度な関係抽出アルゴリズム開発を実現するための効率的なフレームワークである。
関連論文リスト
- Ranking and Combining Latent Structured Predictive Scores without Labeled Data [2.5064967708371553]
本稿では,新しい教師なしアンサンブル学習モデル(SUEL)を提案する。
連続的な予測スコアを持つ予測器のセット間の依存関係を利用して、ラベル付きデータなしで予測器をランク付けし、それらをアンサンブルされたスコアに重み付けする。
提案手法の有効性は、シミュレーション研究とリスク遺伝子発見の現実的応用の両方を通じて厳密に評価されている。
論文 参考訳(メタデータ) (2024-08-14T20:14:42Z) - A Federated Learning-based Industrial Health Prognostics for
Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。
提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文 参考訳(メタデータ) (2023-05-13T07:20:31Z) - A Generative Modeling Framework for Inferring Families of Biomechanical
Constitutive Laws in Data-Sparse Regimes [0.15658704610960567]
本稿では,データスパース体制における関係の家族を効率的に推定する新しい手法を提案する。
機能的先行概念に着想を得て,ニューラル演算子をジェネレータとし,完全接続ネットワークを敵判別器として組み込んだ生成ネットワーク(GAN)を開発した。
論文 参考訳(メタデータ) (2023-05-04T22:07:27Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Combining human parsing with analytical feature extraction and ranking
schemes for high-generalization person reidentification [0.0]
近年,科学と社会の両面での重要性から,人物再識別(re-ID)が注目されている。
機械学習、特にDeep Learning (DL)は、研究者がベンチマークデータセットで前例のない精度のレベルを達成できるようにする主要なRe-idツールとなっている。
本稿では,高一般化の可能性を示す訓練可能なパラメータを含まないモデルを提案する。
論文 参考訳(メタデータ) (2022-07-28T17:22:48Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Generative Data Augmentation for Commonsense Reasoning [75.26876609249197]
G-DAUGCは、低リソース環境でより正確で堅牢な学習を実現することを目的とした、新しい生成データ拡張手法である。
G-DAUGCは、バックトランスレーションに基づく既存のデータ拡張手法を一貫して上回っている。
分析の結果,G-DAUGCは多種多様な流線型学習例を産出し,その選択と学習アプローチが性能向上に重要であることが示された。
論文 参考訳(メタデータ) (2020-04-24T06:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。