論文の概要: Toward Automated Clinical Transcriptions
- arxiv url: http://arxiv.org/abs/2409.15378v1
- Date: Fri, 20 Sep 2024 13:12:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 13:20:55.021651
- Title: Toward Automated Clinical Transcriptions
- Title(参考訳): 臨床転写の自動化に向けて
- Authors: Mitchell A. Klusty, W. Vaiden Logan, Samuel E. Armstrong, Aaron D. Mullen, Caroline N. Leach, Jeff Talbert, V. K. Cody Bumgardner,
- Abstract要約: 本稿では,患者の会話に音声からテキストへの書き起こしと話者ラベル付けの最近の進歩を応用したセキュアなシステムを提案する。
このシステムは、正確な転写と潜在的なエラーをハイライトし、迅速な人間の検証を促進するよう最適化されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Administrative documentation is a major driver of rising healthcare costs and is linked to adverse outcomes, including physician burnout and diminished quality of care. This paper introduces a secure system that applies recent advancements in speech-to-text transcription and speaker-labeling (diarization) to patient-provider conversations. This system is optimized to produce accurate transcriptions and highlight potential errors to promote rapid human verification, further reducing the necessary manual effort. Applied to over 40 hours of simulated conversations, this system offers a promising foundation for automating clinical transcriptions.
- Abstract(参考訳): 管理文書は医療費の上昇の主要な要因であり、医師のバーンアウトやケアの質の低下など、有害な結果に結びついている。
本稿では,音声からテキストへの書き起こしと話者ラベル化(ダイアリゼーション)の最近の進歩を患者間会話に適用するセキュアなシステムを提案する。
このシステムは、正確な書き起こしを生成し、潜在的なエラーを強調し、迅速な人間の検証を促進し、さらに必要な手作業を減らすように最適化されている。
40時間以上のシミュレートされた会話に応用して、このシステムは臨床転写を自動化するための有望な基盤を提供する。
関連論文リスト
- Searching for Best Practices in Medical Transcription with Large Language Model [1.0855602842179624]
本稿では,Large Language Model (LLM) を用いて,高精度な医療書面を生成する手法を提案する。
提案手法は,単語誤り率(WER)を低くし,重要な医療用語の正確な認識を確保するために,高度な言語モデリング技術を統合する。
論文 参考訳(メタデータ) (2024-10-04T03:41:16Z) - A GEN AI Framework for Medical Note Generation [3.7444770630637167]
MediNotesは、医療会話からSOAP(Subjective, Objective, Assessment, Plan)ノートの作成を自動化するために設計された高度な生成AIフレームワークである。
MediNotesはLarge Language Models (LLM)、Retrieval-Augmented Generation (RAG)、Automatic Speech Recognition (ASR)を統合し、テキスト入力と音声入力の両方をリアルタイムで、記録されたオーディオからキャプチャし、処理する。
論文 参考訳(メタデータ) (2024-09-27T23:05:02Z) - Using LLM for Real-Time Transcription and Summarization of Doctor-Patient Interactions into ePuskesmas in Indonesia [0.0]
本稿では,局所的大言語モデル(LLM)を用いて医師と患者の会話の書き起こし,翻訳,要約を行う手法を提案する。
我々はWhisperモデルとGPT-3を用いて、それらをePuskemasの医療記録形式に要約する。
このイノベーションは、過密化された施設やインドネシアの医療提供者に対する管理上の負担といった課題に対処する。
論文 参考訳(メタデータ) (2024-09-25T16:13:42Z) - AI Managed Emergency Documentation with a Pretrained Model [0.0]
本研究では,救急部(ED)退院書状作成の効率化と品質向上を目的とした大規模言語モデルシステムについて検討した。
我々は,ED放電文字の生成における人工知能ソフトウェアの有用性と,この技術に対する医師の態度について検討した。
論文 参考訳(メタデータ) (2024-08-17T13:11:46Z) - Clinical Dialogue Transcription Error Correction using Seq2Seq Models [1.663938381339885]
臨床対話におけるASR転写誤り訂正のためのSeq2seq学習手法を提案する。
我々は、将来の研究のために公開してきたドメイン固有のデータセットを使用して、マスク満載タスクにSeq2seqモデルを微調整する。
論文 参考訳(メタデータ) (2022-05-26T18:27:17Z) - PriMock57: A Dataset Of Primary Care Mock Consultations [66.29154510369372]
本稿では,57件のモック・プライマリ・ケア・コンサルテーションからなる,パブリック・アクセス・高品質データセットの開発について詳述する。
我々の研究は、データセットが会話型医療ASRのベンチマークや、テキストからのコンサルティングノート生成にどのように使用できるかを説明する。
論文 参考訳(メタデータ) (2022-04-01T10:18:28Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - A preliminary study on evaluating Consultation Notes with Post-Editing [67.30200768442926]
医師が作成後にメモを編集して提出する半自動的なアプローチを提案します。
編集後,自動生成したコンサルテーションノートの時間節約に関する予備研究を行う。
これを時間をかけて、スクラッチからメモを書くより速いことに気付きます。
論文 参考訳(メタデータ) (2021-04-09T14:42:00Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Transforming unstructured voice and text data into insight for paramedic
emergency service using recurrent and convolutional neural networks [68.8204255655161]
救急隊員は救急車内で限られた時間内に救命判断をしなければならないことが多い。
本研究の目的は、音声とテキストデータを自動的に融合して、救急隊員に適切な状況認識情報を提供することである。
論文 参考訳(メタデータ) (2020-05-30T06:47:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。