論文の概要: Automatic Speech Recognition for Greek Medical Dictation
- arxiv url: http://arxiv.org/abs/2509.23550v1
- Date: Sun, 28 Sep 2025 01:15:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.28516
- Title: Automatic Speech Recognition for Greek Medical Dictation
- Title(参考訳): ギリシア語医学的ディクテーションのための音声認識
- Authors: Vardis Georgilas, Themos Stafylakis,
- Abstract要約: 本論文の主な目的は,ギリシャ語医療用音声書き起こしのためのドメイン固有システムを作ることである。
自動音声認識技術とテキスト修正モデルを組み合わせたシステムを開発した。
- 参考スコア(独自算出の注目度): 5.543902482518564
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical dictation systems are essential tools in modern healthcare, enabling accurate and efficient conversion of speech into written medical documentation. The main objective of this paper is to create a domain-specific system for Greek medical speech transcriptions. The ultimate goal is to assist healthcare professionals by reducing the overload of manual documentation and improving workflow efficiency. Towards this goal, we develop a system that combines automatic speech recognition techniques with text correction model, allowing better handling of domain-specific terminology and linguistic variations in Greek. Our approach leverages both acoustic and textual modeling to create more realistic and reliable transcriptions. We focused on adapting existing language and speech technologies to the Greek medical context, addressing challenges such as complex medical terminology and linguistic inconsistencies. Through domain-specific fine-tuning, our system achieves more accurate and coherent transcriptions, contributing to the development of practical language technologies for the Greek healthcare sector.
- Abstract(参考訳): 医療ディクテーションシステムは現代医療において欠かせないツールであり、正確かつ効率的な音声の医療文書への変換を可能にする。
本論文の主な目的は,ギリシャ語医療用音声書き起こしのためのドメイン固有システムを作ることである。
最終的な目標は、手作業によるドキュメントのオーバーロードを減らし、ワークフローの効率を改善することで、医療専門家を支援することだ。
本研究の目的は,自動音声認識技術とテキスト補正モデルを組み合わせることで,ギリシア語におけるドメイン固有の用語と言語的バリエーションをよりよく扱うことができるシステムを開発することである。
我々のアプローチは、より現実的で信頼性の高い書き起こしを作成するために、音響とテキストのモデリングの両方を活用する。
我々は,ギリシャ医学の文脈に既存の言語と音声技術を適用し,複雑な医療用語や言語的不整合といった課題に対処することに注力した。
ドメイン固有の微調整により、より正確で一貫性のある転写が達成され、ギリシャの医療分野における実用的な言語技術の発展に寄与する。
関連論文リスト
- Bridging the Gap with Retrieval-Augmented Generation: Making Prosthetic Device User Manuals Available in Marginalised Languages [1.7218681244575125]
この研究は、人工装具のユーザーマニュアルなどの医療文書を処理し、翻訳するために設計されたAI駆動のフレームワークを、疎外された言語に提示する。
医療従事者や患者などのユーザーは、英語の医療機器マニュアルをアップロードしたり、母国語で質問をしたり、正確な回答をリアルタイムで受け取ることができる。
論文 参考訳(メタデータ) (2025-06-30T15:25:58Z) - Searching for Best Practices in Medical Transcription with Large Language Model [1.0855602842179624]
本稿では,Large Language Model (LLM) を用いて,高精度な医療書面を生成する手法を提案する。
提案手法は,単語誤り率(WER)を低くし,重要な医療用語の正確な認識を確保するために,高度な言語モデリング技術を統合する。
論文 参考訳(メタデータ) (2024-10-04T03:41:16Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - The Sound of Healthcare: Improving Medical Transcription ASR Accuracy
with Large Language Models [0.0]
大言語モデル(LLM)は、医学転写における音声認識システム(ASR)の精度を高めることができる。
本研究は, 単語誤り率(WER), 医用概念WER(MC-WER)の精度向上, 話者ダイアリゼーション精度の向上に焦点を当てた。
論文 参考訳(メタデータ) (2024-02-12T14:01:12Z) - Prompt Engineering for Healthcare: Methodologies and Applications [93.63832575498844]
本総説では,医学分野の自然言語処理分野における情報工学の最近の進歩を紹介する。
我々は、迅速なエンジニアリングの開発を提供し、その医療自然言語処理アプリケーションへの重要な貢献を強調します。
論文 参考訳(メタデータ) (2023-04-28T08:03:42Z) - Terminology-aware Medical Dialogue Generation [23.54754465832362]
医療対話生成は,医師と患者との対話の振り返りの履歴に応じて反応を生成することを目的としている。
オープンドメインの対話生成とは異なり、これは医療領域固有の背景知識を必要とする。
そこで本研究では,ドメイン固有語学を中心とした特徴を考慮し,医療対話の創出を改善する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-10-27T15:41:46Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Self-Supervised Knowledge Assimilation for Expert-Layman Text Style
Transfer [63.72621204057025]
エキスパート・レイマン・テキスト・スタイル・トランスファー技術は、科学コミュニティと一般大衆とのコミュニケーションを改善する可能性がある。
専門家が生み出す高品質な情報は、しばしば難しいジャーゴンの平民が理解するのに苦労している。
これは医療分野において特に顕著な問題であり、レイマンはしばしばオンラインの医療テキストに混同される。
論文 参考訳(メタデータ) (2021-10-06T17:57:22Z) - Paragraph-level Simplification of Medical Texts [35.650619024498425]
手動の簡略化は生物医学文献の急速に成長する体にスケールしません。
異なる臨床トピックに関連するすべての公開された証拠の技術的およびレイアウト要約からなる英語での平行テキストの新しいコーパスを紹介します。
本研究では,科学テキストを前提としたマスキング型言語モデルから,確率スコアに基づく新たな指標を提案する。
論文 参考訳(メタデータ) (2021-04-12T18:56:05Z) - Bridging the Modality Gap for Speech-to-Text Translation [57.47099674461832]
エンド・ツー・エンドの音声翻訳は、ある言語における音声を、エンド・ツー・エンドの方法で他の言語におけるテキストに変換することを目的としている。
既存のほとんどの手法では、音響表現と意味情報を同時に学習するために、単一のエンコーダを持つエンコーダ・デコーダ構造を用いる。
本稿では,音声とテキスト間のモダリティギャップを埋めることで,エンドツーエンドのモデル性能を向上させることを目的とした音声翻訳モデルのための音声テキスト適応手法を提案する。
論文 参考訳(メタデータ) (2020-10-28T12:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。