論文の概要: MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions
- arxiv url: http://arxiv.org/abs/2410.09729v2
- Date: Tue, 12 Nov 2024 04:19:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-13 13:18:33.457822
- Title: MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions
- Title(参考訳): MIRAGE:インドの一般的な説明文におけるアノテーションのマルチモーダル識別と認識
- Authors: Tavish Mankash, V. S. Chaithanya Kota, Anish De, Praveen Prakash, Kshitij Jadhav,
- Abstract要約: エレクトロニック・メディカル・レコード(EMR)が利用可能であるにもかかわらず、インドの病院は依然として手書きの医療記録に依存している。
手書きのレコードはユニークな課題であり、治療薬とその推奨パターンを認識するために、トレーニングモデルに特別なデータを必要とする。
本手法は薬剤名と服用量を82%の精度で抽出する。
- 参考スコア(独自算出の注目度): 1.1650821883155187
- License:
- Abstract: Hospitals in India still rely on handwritten medical records despite the availability of Electronic Medical Records (EMR), complicating statistical analysis and record retrieval. Handwritten records pose a unique challenge, requiring specialized data for training models to recognize medications and their recommendation patterns. While traditional handwriting recognition approaches employ 2-D LSTMs, recent studies have explored using Multimodal Large Language Models (MLLMs) for OCR tasks. Building on this approach, we focus on extracting medication names and dosages from simulated medical records. Our methodology MIRAGE (Multimodal Identification and Recognition of Annotations in indian GEneral prescriptions) involves fine-tuning the QWEN VL, LLaVA 1.6 and Idefics2 models on 743,118 high resolution simulated medical record images-fully annotated from 1,133 doctors across India. Our approach achieves 82% accuracy in extracting medication names and dosages.
- Abstract(参考訳): インドの病院は、EMR(Electronic Medical Records)が利用可能であるにもかかわらず、手書きの医療記録に依存しており、統計分析と記録検索を複雑にしている。
手書きのレコードはユニークな課題であり、治療薬とその推奨パターンを認識するために、トレーニングモデルに特別なデータを必要とする。
従来の手書き文字認識手法では2次元LSTMを採用しているが、近年ではOCRタスクにMLLM(Multimodal Large Language Models)を用いた研究が行われている。
本手法を基礎として, 模擬医療記録から医薬品名と服用量を抽出することに焦点を当てた。
MIRAGE (Multimodal Identification and Recognition of Annotations in indian GEneral prescriptions) では,インド中の1,133人の医師から得られた高解像度の医用記録画像を用いて,QWEN VL, LLaVA 1.6, Idefics2モデルの微調整を行う。
本手法は薬剤名と服用量を82%の精度で抽出する。
関連論文リスト
- LLMD: A Large Language Model for Interpreting Longitudinal Medical Records [0.044940580193534]
本稿では,患者の医療履歴を医療記録に基づいて分析する大規模言語モデルを提案する。
LLMDはドメイン知識とともに、時間と施設間で収集された大量のレコードのコーパスで訓練されている。
このアプローチは患者の健康を正確に表現するために重要であり、知識だけで訓練されたモデルよりも独特なアドバンテージを持っている。
論文 参考訳(メタデータ) (2024-10-11T20:55:51Z) - Searching for Best Practices in Medical Transcription with Large Language Model [1.0855602842179624]
本稿では,Large Language Model (LLM) を用いて,高精度な医療書面を生成する手法を提案する。
提案手法は,単語誤り率(WER)を低くし,重要な医療用語の正確な認識を確保するために,高度な言語モデリング技術を統合する。
論文 参考訳(メタデータ) (2024-10-04T03:41:16Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping [1.8630636381951384]
大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
検索拡張生成とMapReduceにより強化されたゼロショットLLM法を提案する。
肺動脈圧の上昇を特徴とする稀な疾患である肺高血圧症(PH)に対して本法を適用した。
論文 参考訳(メタデータ) (2023-12-11T15:45:27Z) - Med-Flamingo: a Multimodal Medical Few-shot Learner [58.85676013818811]
医療領域に適応したマルチモーダル・数ショット学習者であるMed-Flamingoを提案する。
OpenFlamingo-9Bに基づいて、出版物や教科書からの医療画像テキストデータのペア化とインターリーブ化を継続する。
本研究は,医療用VQA(ジェネレーティブ医療用VQA)の最初の人間評価である。
論文 参考訳(メタデータ) (2023-07-27T20:36:02Z) - A Marker-based Neural Network System for Extracting Social Determinants
of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。
多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。
我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文 参考訳(メタデータ) (2022-12-24T18:40:23Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Medical-VLBERT: Medical Visual Language BERT for COVID-19 CT Report
Generation With Alternate Learning [70.71564065885542]
本稿では,医療用ビジュアル言語BERT(Medical-VLBERT)モデルを用いて,新型コロナウイルススキャンの異常を同定する。
このモデルは、知識事前学習と伝達の2つの手順で、代替的な学習戦略を採用する。
COVID-19患者に対する医療報告の自動作成のために,中国語で368例,胸部CTで1104例の検診を行った。
論文 参考訳(メタデータ) (2021-08-11T07:12:57Z) - Labeling of Multilingual Breast MRI Reports [1.8374319565577157]
LAMBRと呼ばれるカスタム言語表現を用いた多言語乳房MRIレポート分類器の開発のためのフレームワークを提案する。
提案手法は,臨床現場で直面する実践的課題を克服し,医療報告からラベルを抽出する際の性能向上を実証する。
論文 参考訳(メタデータ) (2020-07-06T19:22:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。