論文の概要: A Biomedical Entity Extraction Pipeline for Oncology Health Records in
Portuguese
- arxiv url: http://arxiv.org/abs/2304.08999v1
- Date: Tue, 18 Apr 2023 14:10:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 14:31:51.789099
- Title: A Biomedical Entity Extraction Pipeline for Oncology Health Records in
Portuguese
- Title(参考訳): ポルトガルにおけるオンコロジー健康記録のためのバイオメディカルエンティティ抽出パイプライン
- Authors: Hugo Sousa, Arian Pasquali, Al\'ipio Jorge, Catarina Sousa Santos,
M\'ario Amorim Lopes
- Abstract要約: ポルトガル語で書かれた腫瘍の健康記録から, 治療法, 薬物, 疾患を抽出するためのアプローチを提案する。
このプロジェクトはポルトガルオンコロジー研究所(英語版)と共同で実施され、10ドル以上の厳重に保護された医療記録の他に、プロジェクトの開発を通じてオンコロジーの専門家の専門知識も提供された。
ポルトガルでは,生物医学的実体抽出のための注釈付きコーパスが存在しないため,モデル開発のための注釈付きコーパスも提案する。
- 参考スコア(独自算出の注目度): 0.10499611180329801
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Textual health records of cancer patients are usually protracted and highly
unstructured, making it very time-consuming for health professionals to get a
complete overview of the patient's therapeutic course. As such limitations can
lead to suboptimal and/or inefficient treatment procedures, healthcare
providers would greatly benefit from a system that effectively summarizes the
information of those records. With the advent of deep neural models, this
objective has been partially attained for English clinical texts, however, the
research community still lacks an effective solution for languages with limited
resources. In this paper, we present the approach we developed to extract
procedures, drugs, and diseases from oncology health records written in
European Portuguese. This project was conducted in collaboration with the
Portuguese Institute for Oncology which, besides holding over $10$ years of
duly protected medical records, also provided oncologist expertise throughout
the development of the project. Since there is no annotated corpus for
biomedical entity extraction in Portuguese, we also present the strategy we
followed in annotating the corpus for the development of the models. The final
models, which combined a neural architecture with entity linking, achieved
$F_1$ scores of $88.6$, $95.0$, and $55.8$ per cent in the mention extraction
of procedures, drugs, and diseases, respectively.
- Abstract(参考訳): がん患者のテキストによる健康記録は、通常、長引いて高度に構造化されていないため、医療専門家が患者の治療方針の完全な概観を得るのに非常に時間がかかる。
このような制限は、最適あるいは非効率な治療手順につながる可能性があるため、医療提供者はこれらの記録情報を効果的に要約するシステムから大きな恩恵を受けるだろう。
深層神経モデルの出現により、この目的の一部は英語の臨床文書に対して達成されてきたが、研究コミュニティは限られた資源を持つ言語に対して効果的な解決策をいまだに欠いている。
本稿では,ヨーロッパ・ポルトガル語で書かれた腫瘍学の健康記録から手順,薬剤,疾患を抽出する手法を提案する。
このプロジェクトはポルトガルオンコロジー研究所(英語版)と共同で実施され、10ドル以上の厳重に保護された医療記録の他に、プロジェクトの開発を通じてオンコロジーの専門知識も提供された。
ポルトガルでは,生物医学的実体抽出のための注釈付きコーパスが存在しないため,モデル開発のためのコーパスの注釈付けに追従した戦略も提示する。
最終的なモデルは、ニューラルネットワークとエンティティリンクを組み合わせたもので、それぞれ8,8.6$、95.0$、55.8$のスコアで、手順、薬物、疾患の抽出でそれぞれ5.8$のスコアを得た。
関連論文リスト
- BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.39593644054865]
BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。
われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。
BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文 参考訳(メタデータ) (2025-01-13T09:58:03Z) - Clinical Trials Ontology Engineering with Large Language Models [0.0]
本稿では,臨床試験データを簡易かつ効果的な方法で抽出・統合する手法を提案する。
大規模な言語モデル(LLM)は、コストと時間の観点から、このプロセスを自動化するための実行可能な選択肢であることを示している。
本研究は,臨床実験からのリアルタイムデータ統合が標準となる医療研究における重要な意味を指摘する。
論文 参考訳(メタデータ) (2024-12-18T22:40:52Z) - Large Language Model Distilling Medication Recommendation Model [58.94186280631342]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - An Analysis on Large Language Models in Healthcare: A Case Study of
BioBERT [0.0]
本稿では,大規模言語モデル,特にBioBERTを医療に応用するための包括的調査を行う。
この分析は、医療領域のユニークなニーズを満たすために、BioBERTを微調整するための体系的な方法論を概説している。
本論文は、倫理的考察、特に患者のプライバシーとデータセキュリティを徹底的に検討する。
論文 参考訳(メタデータ) (2023-10-11T08:16:35Z) - Advancing Italian Biomedical Information Extraction with
Transformers-based Models: Methodological Insights and Multicenter Practical
Application [0.27027468002793437]
インフォメーション抽出は、自動化されたテキストマイニングパイプラインを使用することで、臨床実践者が限界を克服するのに役立つ。
我々は、最初のイタリアの神経心理学的名前付きエンティティ認識データセットであるPsyNITを作成し、それをトランスフォーマーベースのモデルの開発に利用した。
i)一貫性のあるアノテーションプロセスの重要な役割と(ii)古典的なメソッドと“低リソース”なアプローチを組み合わせた微調整戦略です。
論文 参考訳(メタデータ) (2023-06-08T16:15:46Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - A Unified Framework of Medical Information Annotation and Extraction for
Chinese Clinical Text [1.4841452489515765]
現在の最先端(SOTA)NLPモデルは、ディープラーニング技術と高度に統合されている。
本研究では,医学的実体認識,関係抽出,属性抽出の工学的枠組みを提案する。
論文 参考訳(メタデータ) (2022-03-08T03:19:16Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Multilingual Medical Question Answering and Information Retrieval for
Rural Health Intelligence Access [1.0499611180329804]
いくつかの発展途上国の農村部では、高品質な医療、医療インフラ、専門的診断へのアクセスはほとんど利用できない。
このような医療アクセスの欠如、患者の以前の健康記録の欠如、および先住民語での情報の置換によるいくつかの死を、容易に防ぐことができる。
本稿では,機械学習とNLP(Natural Language Processing)技術における現象の進展を利用して,低リソース・多言語・予備的ファーストポイント・オブ・コンタクト・メディカルアシスタントを設計するアプローチについて述べる。
論文 参考訳(メタデータ) (2021-06-02T16:05:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。