Fugu-MT 論文翻訳(概要): MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions

論文の概要: MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions

arxiv url: http://arxiv.org/abs/2410.09729v2
Date: Tue, 12 Nov 2024 04:19:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:35.309634
Title: MIRAGE: Multimodal Identification and Recognition of Annotations in Indian General Prescriptions
Title（参考訳）: MIRAGE:インドの一般的な説明文におけるアノテーションのマルチモーダル識別と認識
Authors: Tavish Mankash, V. S. Chaithanya Kota, Anish De, Praveen Prakash, Kshitij Jadhav,
Abstract要約: エレクトロニック・メディカル・レコード(EMR)が利用可能であるにもかかわらず、インドの病院は依然として手書きの医療記録に依存している。手書きのレコードはユニークな課題であり、治療薬とその推奨パターンを認識するために、トレーニングモデルに特別なデータを必要とする。本手法は薬剤名と服用量を82%の精度で抽出する。
参考スコア（独自算出の注目度）: 1.1650821883155187
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Hospitals in India still rely on handwritten medical records despite the availability of Electronic Medical Records (EMR), complicating statistical analysis and record retrieval. Handwritten records pose a unique challenge, requiring specialized data for training models to recognize medications and their recommendation patterns. While traditional handwriting recognition approaches employ 2-D LSTMs, recent studies have explored using Multimodal Large Language Models (MLLMs) for OCR tasks. Building on this approach, we focus on extracting medication names and dosages from simulated medical records. Our methodology MIRAGE (Multimodal Identification and Recognition of Annotations in indian GEneral prescriptions) involves fine-tuning the QWEN VL, LLaVA 1.6 and Idefics2 models on 743,118 high resolution simulated medical record images-fully annotated from 1,133 doctors across India. Our approach achieves 82% accuracy in extracting medication names and dosages.
Abstract（参考訳）: インドの病院は、EMR(Electronic Medical Records)が利用可能であるにもかかわらず、手書きの医療記録に依存しており、統計分析と記録検索を複雑にしている。手書きのレコードはユニークな課題であり、治療薬とその推奨パターンを認識するために、トレーニングモデルに特別なデータを必要とする。従来の手書き文字認識手法では2次元LSTMを採用しているが、近年ではOCRタスクにMLLM(Multimodal Large Language Models)を用いた研究が行われている。本手法を基礎として, 模擬医療記録から医薬品名と服用量を抽出することに焦点を当てた。 MIRAGE (Multimodal Identification and Recognition of Annotations in indian GEneral prescriptions) では,インド中の1,133人の医師から得られた高解像度の医用記録画像を用いて,QWEN VL, LLaVA 1.6, Idefics2モデルの微調整を行う。本手法は薬剤名と服用量を82%の精度で抽出する。

関連論文リスト

ProtoMedX: Towards Explainable Multi-Modal Prototype Learning for Bone Health Classification [5.29568690662347]
ProtoMedXはマルチモーダル(マルチモーダル)モデルであり、腰椎のDEXAスキャンと患者の記録の両方を使用する。視覚のみのタスクでは87.58%、マルチモーダル版では89.8%の精度を達成しており、どちらも既存の手法を超越している。
論文参考訳（メタデータ） (2025-09-18T10:46:18Z)
DR.EHR: Dense Retrieval for Electronic Health Record with Knowledge Injection and Synthetic Data [2.9929405444223205]
EHRは臨床実践において重要な役割を担っているが、その検索は主に意味的ギャップの問題によって困難である。近年の高密度検索の進歩は有望なソリューションを提供するが、医療知識の不足やトレーニングコーパスのミスマッチにより、一般ドメインとバイオメディカルドメインの両方の既存のモデルは不足している。本稿では,EHR検索に適した高密度検索モデルであるtexttDR.EHRを紹介する。
論文参考訳（メタデータ） (2025-07-24T17:02:46Z)
Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [57.873833577058]
医療知識の豊富なマルチモーダルデータセットを構築した。次に医学専門のMLLMであるLingshuを紹介します。 Lingshuは、医療専門知識の組み込みとタスク解決能力の向上のために、マルチステージトレーニングを行っている。
論文参考訳（メタデータ） (2025-06-08T08:47:30Z)
Do "New Snow Tablets" Contain Snow? Large Language Models Over-Rely on Names to Identify Ingredients of Chinese Drugs [79.00288739947406]
伝統的な中国医学(TCM)は医療に採用され、臨床応用をサポートするために、LLM(Large Language Models)が出現している。これらのモデルの基本的な要件は、TCM薬物成分の正確な同定である。我々の系統的分析では、一貫した障害パターンが明らかである: モデルでは、しばしば文字通り、薬物名を理解し、関連性に関係なく共通のハーブを過剰に使用し、不慣れな定式化に直面した時に不規則な振る舞いを示す。
論文参考訳（メタデータ） (2025-04-03T17:43:45Z)
Natural Language-Assisted Multi-modal Medication Recommendation [97.07805345563348]
NLA-MMR(Natural Language-Assisted Multi-modal Medication Recommendation)を紹介する。 NLA-MMRは、患者視点から知識を学習し、医薬視点を共同で学習するために設計されたマルチモーダルアライメントフレームワークである。本稿では,プレトレーニング言語モデル(PLM)を用いて,患者や医薬品に関するドメイン内知識を抽出する。
論文参考訳（メタデータ） (2025-01-13T09:51:50Z)
Leveraging Deep Learning with Multi-Head Attention for Accurate Extraction of Medicine from Handwritten Prescriptions [1.5430108139561782]
本稿では,Mask R-CNN と Transformer-based Optical Character Recognition (TrOCR) を組み合わせた医薬名抽出手法を提案する。提案手法は標準ベンチマークで1.4%の文字誤り率(CER)を達成した。
論文参考訳（メタデータ） (2024-12-24T06:09:33Z)
LLMD: A Large Language Model for Interpreting Longitudinal Medical Records [0.044940580193534]
本稿では,患者の医療履歴を医療記録に基づいて分析する大規模言語モデルを提案する。 LLMDはドメイン知識とともに、時間と施設間で収集された大量のレコードのコーパスで訓練されている。このアプローチは患者の健康を正確に表現するために重要であり、知識だけで訓練されたモデルよりも独特なアドバンテージを持っている。
論文参考訳（メタデータ） (2024-10-11T20:55:51Z)
Searching for Best Practices in Medical Transcription with Large Language Model [1.0855602842179624]
本稿では,Large Language Model (LLM) を用いて,高精度な医療書面を生成する手法を提案する。提案手法は,単語誤り率(WER)を低くし,重要な医療用語の正確な認識を確保するために,高度な言語モデリング技術を統合する。
論文参考訳（メタデータ） (2024-10-04T03:41:16Z)
Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文参考訳（メタデータ） (2024-04-27T05:03:42Z)
Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文参考訳（メタデータ） (2024-02-05T08:25:22Z)
Large Language Models with Retrieval-Augmented Generation for Zero-Shot Disease Phenotyping [1.8630636381951384]
大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。検索拡張生成とMapReduceにより強化されたゼロショットLLM法を提案する。肺動脈圧の上昇を特徴とする稀な疾患である肺高血圧症(PH)に対して本法を適用した。
論文参考訳（メタデータ） (2023-12-11T15:45:27Z)
Med-Flamingo: a Multimodal Medical Few-shot Learner [58.85676013818811]
医療領域に適応したマルチモーダル・数ショット学習者であるMed-Flamingoを提案する。 OpenFlamingo-9Bに基づいて、出版物や教科書からの医療画像テキストデータのペア化とインターリーブ化を継続する。本研究は,医療用VQA(ジェネレーティブ医療用VQA)の最初の人間評価である。
論文参考訳（メタデータ） (2023-07-27T20:36:02Z)
A Marker-based Neural Network System for Extracting Social Determinants of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文参考訳（メタデータ） (2022-12-24T18:40:23Z)
Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。本手法が患者の退院指示生成に有効であることを示す。
論文参考訳（メタデータ） (2022-10-23T16:34:39Z)
Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文参考訳（メタデータ） (2022-04-10T21:46:52Z)
Medical-VLBERT: Medical Visual Language BERT for COVID-19 CT Report Generation With Alternate Learning [70.71564065885542]
本稿では,医療用ビジュアル言語BERT(Medical-VLBERT)モデルを用いて,新型コロナウイルススキャンの異常を同定する。このモデルは、知識事前学習と伝達の2つの手順で、代替的な学習戦略を採用する。 COVID-19患者に対する医療報告の自動作成のために,中国語で368例,胸部CTで1104例の検診を行った。
論文参考訳（メタデータ） (2021-08-11T07:12:57Z)
Labeling of Multilingual Breast MRI Reports [1.8374319565577157]
LAMBRと呼ばれるカスタム言語表現を用いた多言語乳房MRIレポート分類器の開発のためのフレームワークを提案する。提案手法は,臨床現場で直面する実践的課題を克服し,医療報告からラベルを抽出する際の性能向上を実証する。
論文参考訳（メタデータ） (2020-07-06T19:22:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。