論文の概要: MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions
- arxiv url: http://arxiv.org/abs/2410.09729v1
- Date: Sun, 13 Oct 2024 05:19:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 05:12:47.693249
- Title: MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions
- Title(参考訳): MIRAGE:インドの一般的な説明文におけるアノテーションのマルチモーダル識別と認識
- Authors: Tavish Mankash, V. S. Chaithanya Kota, Anish De, Praveen Prakash, Kshitij Jadhav,
- Abstract要約: 手書き処方薬はユニークな課題であり、薬の認識のために訓練モデルに特別なデータを必要とする。
我々は医療記録から薬名を取り出すことに重点を置いている。
薬剤名と服薬量抽出の精度は82%であった。
- 参考スコア(独自算出の注目度): 1.1650821883155187
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hospitals generate thousands of handwritten prescriptions, a practice that remains prevalent despite the availability of Electronic Medical Records (EMR). This method of record-keeping hinders the examination of long-term medication effects, impedes statistical analysis, and makes the retrieval of records challenging. Handwritten prescriptions pose a unique challenge, requiring specialized data for training models to recognize medications and their patterns of recommendation. While current handwriting recognition approaches typically employ 2-D LSTMs, recent studies have explored the use of Large Language Models (LLMs) for Optical Character Recognition (OCR). Building on this approach, we focus on extracting medication names from medical records. Our methodology MIRAGE (Multimodal Identification and Recognition of Annotations in indian GEneral prescriptions) involves fine-tuning the LLaVA 1.6 and Idefics2 models. Our research utilizes a dataset provided by Medyug Technology, consisting of 743,118 fully annotated high-resolution simulated medical records from 1,133 doctors across India. We demonstrate that our methodology exhibits 82% accuracy in medication name and dosage extraction. We provide a detailed account of our research methodology and results, notes about HWR with Multimodal LLMs, and release a small dataset of 100 medical records with labels.
- Abstract(参考訳): 病院は、EMR(Electronic Medical Records)が利用可能であるにもかかわらず、何千もの手書き処方薬を製造している。
この記録保持方法は、長期薬物効果の検査を妨げ、統計解析を阻害し、記録の検索を困難にする。
手書き処方薬はユニークな課題であり、処方薬とその推奨パターンを認識するために、訓練モデルに特別なデータを必要とする。
現在の手書き文字認識手法では2次元LSTMを用いるのが一般的であるが、近年では光学文字認識 (OCR) にLarge Language Models (LLM) を用いることが検討されている。
このアプローチに基づいて,医療記録から医薬品名を抽出することに焦点を当てた。
MIRAGE (Multimodal Identification and Recognition of Annotations in indian GEneral prescriptions) はLLaVA 1.6およびIdefics2モデルを微調整する。
インドで1,133人の医師が作成した,743,118個の注釈付き高解像度医療記録からなるMedyug Technologyのデータセットを活用している。
本手法は服薬名と服薬量抽出の精度が82%であることが実証された。
本研究の方法論と成果を詳述するとともに,HWRとMultimodal LLMを併用したノートを作成し,ラベル付き医療記録100件の小さなデータセットを公表した。
関連論文リスト
- LLMD: A Large Language Model for Interpreting Longitudinal Medical Records [0.044940580193534]
本稿では,患者の医療履歴を医療記録に基づいて分析する大規模言語モデルを提案する。
LLMDはドメイン知識とともに、時間と施設間で収集された大量のレコードのコーパスで訓練されている。
このアプローチは患者の健康を正確に表現するために重要であり、知識だけで訓練されたモデルよりも独特なアドバンテージを持っている。
論文 参考訳(メタデータ) (2024-10-11T20:55:51Z) - EHRmonize: A Framework for Medical Concept Abstraction from Electronic Health Records using Large Language Models [21.637722557192482]
EHRデータから医療概念を抽象化するために,大規模言語モデルを活用するフレームワークであるEHRmonizeを紹介する。
本研究は,2つの自由テキスト抽出と6つのバイナリ分類タスクにおいて,実世界のEHRデータベースからの薬物データを用いて5つのLSMを評価する。
GPT-4oはジェネリックルート名同定において97%,ジェネリックドラッグ名では82%,抗生物質のバイナリ分類では100%の精度を達成した。
論文 参考訳(メタデータ) (2024-06-28T21:39:20Z) - Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - OntoMedRec: Logically-Pretrained Model-Agnostic Ontology Encoders for
Medication Recommendation [33.82146975306507]
OntoMedRecは、論理的に事前訓練された、モデルに依存しない医療用オントロジーである。
OntoMedRecの有効性を評価するため,ベンチマークデータセットの総合的な実験を行った。
論文 参考訳(メタデータ) (2024-01-29T00:29:39Z) - A Marker-based Neural Network System for Extracting Social Determinants
of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。
多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。
我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文 参考訳(メタデータ) (2022-12-24T18:40:23Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Medical-VLBERT: Medical Visual Language BERT for COVID-19 CT Report
Generation With Alternate Learning [70.71564065885542]
本稿では,医療用ビジュアル言語BERT(Medical-VLBERT)モデルを用いて,新型コロナウイルススキャンの異常を同定する。
このモデルは、知識事前学習と伝達の2つの手順で、代替的な学習戦略を採用する。
COVID-19患者に対する医療報告の自動作成のために,中国語で368例,胸部CTで1104例の検診を行った。
論文 参考訳(メタデータ) (2021-08-11T07:12:57Z) - Learning-based Computer-aided Prescription Model for Parkinson's
Disease: A Data-driven Perspective [61.70045118068213]
我々は、PD患者の症状と、神経科医が提供した処方薬を収集し、データセットを構築した。
そこで我々は、観察された症状と処方薬との関係を学習し、新しいコンピュータ支援処方薬モデルを構築した。
新来の患者に対しては、処方薬モデルにより、観察された症状に対して適切な処方薬を推奨できる(予測)。
論文 参考訳(メタデータ) (2020-07-31T14:34:35Z) - Labeling of Multilingual Breast MRI Reports [1.8374319565577157]
LAMBRと呼ばれるカスタム言語表現を用いた多言語乳房MRIレポート分類器の開発のためのフレームワークを提案する。
提案手法は,臨床現場で直面する実践的課題を克服し,医療報告からラベルを抽出する際の性能向上を実証する。
論文 参考訳(メタデータ) (2020-07-06T19:22:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。