論文の概要: Doctors Handwritten Prescription Recognition System In Multi Language
Using Deep Learning
- arxiv url: http://arxiv.org/abs/2210.11666v1
- Date: Fri, 21 Oct 2022 01:32:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 13:15:48.748741
- Title: Doctors Handwritten Prescription Recognition System In Multi Language
Using Deep Learning
- Title(参考訳): 深層学習を用いた多言語における医師の手書き処方文認識システム
- Authors: Pavithiran G, Sharan Padmanabhan, Nuvvuru Divya, Aswathy V, Irene
Jerusha P, Chandar B
- Abstract要約: 医師は通常、理解できない手書きで書くため、一般大衆や一部の薬剤師が処方した薬の理解が困難になる。
このプロジェクトでは、認識システムを使用して、任意の言語で医師の筆跡を翻訳するツールを構築する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Doctors typically write in incomprehensible handwriting, making it difficult
for both the general public and some pharmacists to understand the medications
they have prescribed. It is not ideal for them to write the prescription
quietly and methodically because they will be dealing with dozens of patients
every day and will be swamped with work.As a result, their handwriting is
illegible. This may result in reports or prescriptions consisting of short
forms and cursive writing that a typical person or pharmacist won't be able to
read properly, which will cause prescribed medications to be misspelled.
However, some individuals are accustomed to writing prescriptions in regional
languages because we all live in an area with a diversity of regional
languages. It makes analyzing the content much more challenging. So, in this
project, we'll use a recognition system to build a tool that can translate the
handwriting of physicians in any language. This system will be made into an
application which is fully autonomous in functioning. As the user uploads the
prescription image the program will pre-process the image by performing image
pre-processing, and word segmentations initially before processing the image
for training. And it will be done for every language we require the model to
detect. And as of the deduction model will be made using deep learning
techniques including CNN, RNN, and LSTM, which are utilized to train the model.
To match words from various languages that will be written in the system,
Unicode will be used. Furthermore, fuzzy search and market basket analysis are
employed to offer an end result that will be optimized from the pharmaceutical
database and displayed to the user as a structured output.
- Abstract(参考訳): 医師は通常、理解できない手書きで書くため、一般大衆と一部の薬剤師が処方した薬の理解が困難になる。
毎日何十人もの患者を診察し、仕事に没頭させるため、ひっそりと体系的に処方書を書くのは理想的ではない。
これは、典型的な人や薬剤師が適切に読むことができないという短い形や筆記からなる報告や処方書によって、所定の薬品が誤記されるおそれがある。
しかし、地域言語が多様である地域に住んでいるため、地域言語で処方文を書くことに慣れている人もいる。
コンテンツの分析がさらに難しくなる。
そこで、このプロジェクトでは、あらゆる言語で医師の手書きを翻訳できるツールを構築するために、認識システムを使用します。
このシステムは、機能的に完全に自律的なアプリケーションになるでしょう。
ユーザーが処方画像をアップロードすると、プログラムは、画像前処理を実行し、訓練のために画像を処理する前に単語セグメンテーションを行う。
そして、モデルが検出する必要があるすべての言語で実行されます。
また,提案モデルでは,CNN,RNN,LSTMなどの深層学習技術を用いて,モデル学習に活用する。
システムで記述される様々な言語の単語にマッチするために、Unicodeが使用される。
さらに、ファジィ検索とマーケットバスケット分析を用いて、医薬品データベースから最適化され、構造化された出力としてユーザーに表示される最終結果を提供する。
関連論文リスト
- Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Stop Pre-Training: Adapt Visual-Language Models to Unseen Languages [3.3227703089509304]
本稿では,MPLM を用いた視覚言語事前学習を未確認言語に適用するための,シンプルかつ効率的なアプローチを提案する。
我々のアプローチでは画像入力は必要とせず、主に機械翻訳を使用し、ターゲット言語データを必要としない。
論文 参考訳(メタデータ) (2023-06-29T08:20:57Z) - Advancing Medical Imaging with Language Models: A Journey from N-grams
to ChatGPT [2.4492242722754107]
本稿では,言語モデルを用いて手作業を改善する医療画像の分野での研究者に対するレビューとチュートリアルを提供する。
臨床ワークフロー効率の向上,診断エラーの低減,医療専門家の時間的かつ正確な診断支援など,医用画像解析のための正確かつ効率的な言語モデルの有用性について検討した。
論文 参考訳(メタデータ) (2023-04-11T01:17:11Z) - Towards Unifying Medical Vision-and-Language Pre-training via Soft
Prompts [63.84720380390935]
textiti. には、重い融合モジュールを使用するかどうかに応じて、融合エンコーダタイプと二重エンコーダタイプという2つの典型的なタイプがある。
PTUnifier という2つのタイプを統一する手法を提案する。
まず、最も代表的な画像/テキストを格納する機能バンクとして機能する視覚的およびテキスト的プロンプトを導入することで、入力形式を統一する。
論文 参考訳(メタデータ) (2023-02-17T15:43:42Z) - Language Models sounds the Death Knell of Knowledge Graphs [0.0]
ディープラーニングに基づくNLP、特にLarge Language Models(LLM)は広く受け入れられており、多くのアプリケーションで広く使われている。
BioBERTとMed-BERTは医療分野向けに事前訓練された言語モデルである。
本稿では、知識グラフを用いることは、この領域の問題を解決する最善の解決策ではない、と論じる。
論文 参考訳(メタデータ) (2023-01-10T14:20:15Z) - Align, Reason and Learn: Enhancing Medical Vision-and-Language
Pre-training with Knowledge [68.90835997085557]
本稿では,3つの視点から構造化された医療知識を高めるための体系的かつ効果的なアプローチを提案する。
まず、視覚エンコーダと言語エンコーダの表現を知識を通して整列する。
次に,多モード融合モデルに知識を注入し,入力画像とテキストの補足として知識を用いた推論を可能にする。
第3に、知識によって引き起こされるプレテキストタスクを設計することで、画像やテキストの最も重要な情報に重点を置くよう、モデルを指導する。
論文 参考訳(メタデータ) (2022-09-15T08:00:01Z) - Multi-Modal Masked Autoencoders for Medical Vision-and-Language
Pre-Training [62.215025958347105]
マルチモーダルマスク付きオートエンコーダを用いた自己教師型学習パラダイムを提案する。
我々は、ランダムにマスキングされた画像やテキストから欠落したピクセルやトークンを再構成することで、クロスモーダルなドメイン知識を学習する。
論文 参考訳(メタデータ) (2022-09-15T07:26:43Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - Does the Magic of BERT Apply to Medical Code Assignment? A Quantitative
Study [2.871614744079523]
事前訓練されたモデルが、さらなるアーキテクチャエンジニアリングなしで医療コード予測に有用かどうかは明らかではない。
本稿では,単語間のインタラクションをキャプチャし,ラベル情報を活用する階層的な微調整アーキテクチャを提案する。
現在の傾向とは対照的に、我々は慎重に訓練された古典的なCNNは、頻繁なコードでMIMIC-IIIサブセット上の注意ベースのモデルを上回ることを実証します。
論文 参考訳(メタデータ) (2021-03-11T07:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。