論文の概要: Automatic Speech Recognition for Biomedical Data in Bengali Language
- arxiv url: http://arxiv.org/abs/2406.12931v1
- Date: Sun, 16 Jun 2024 10:49:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-22 00:37:55.286999
- Title: Automatic Speech Recognition for Biomedical Data in Bengali Language
- Title(参考訳): ベンガル語における生体データの自動音声認識
- Authors: Shariar Kabir, Nazmun Nahar, Shyamasree Saha, Mamunur Rashid,
- Abstract要約: 本稿では,ベンガルのバイオメディカルデータに特化して設計されたASR(Automatic Speech Recognition)システムの開発について述べる。
ベンガルASRの最近の進歩は奨励されているが、ドメイン固有のデータがないため、実用的な医療ASRモデルの作成が制限されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents the development of a prototype Automatic Speech Recognition (ASR) system specifically designed for Bengali biomedical data. Recent advancements in Bengali ASR are encouraging, but a lack of domain-specific data limits the creation of practical healthcare ASR models. This project bridges this gap by developing an ASR system tailored for Bengali medical terms like symptoms, severity levels, and diseases, encompassing two major dialects: Bengali and Sylheti. We train and evaluate two popular ASR frameworks on a comprehensive 46-hour Bengali medical corpus. Our core objective is to create deployable health-domain ASR systems for digital health applications, ultimately increasing accessibility for non-technical users in the healthcare sector.
- Abstract(参考訳): 本稿では,ベンガルのバイオメディカルデータに特化して設計されたASR(Automatic Speech Recognition)システムの開発について述べる。
ベンガルASRの最近の進歩は奨励されているが、ドメイン固有のデータがないため、実用的な医療ASRモデルの作成が制限されている。
このプロジェクトは、ベンガル語医学用語(症状、重症度、疾患など)に適したASRシステムを開発することでこのギャップを埋め、ベンガル語とシルヘティ語を含む2つの主要な方言を包含する。
46時間のベンガル医療コーパスを用いて,2つのASRフレームワークを訓練し,評価した。
私たちの中核的な目標は、デジタルヘルスアプリケーションのためのデプロイ可能なヘルスドメインASRシステムを作ることです。
関連論文リスト
- AutoRG-Brain: Grounded Report Generation for Brain MRI [57.22149878985624]
放射線学者は、大量の画像を日々のベースで解釈し、対応するレポートを生成する責任を負う。
この要求される作業負荷は、人間のエラーのリスクを高め、治療の遅れ、医療費の増加、収益損失、運用上の不効率につながる可能性がある。
地盤自動報告生成(AutoRG)に関する一連の研究を開始した。
このシステムは、脳の構造の明細化、異常の局所化、そしてよく組織化された発見の生成をサポートする。
論文 参考訳(メタデータ) (2024-07-23T17:50:00Z) - Artificial Intelligence-based Decision Support Systems for Precision and Digital Health [0.49109372384514843]
我々は、AIによって提供される機会、具体的には強化学習から現在のヘルスケアのトレンドまでについて論じる。
我々は適応的な介入の分野に焦点を当てる。
この記事は匿名レビューを受けており、"Frontiers of Statistics and Data Science"の巻の書籍章として意図されている。
論文 参考訳(メタデータ) (2024-07-22T21:39:34Z) - Unsupervised Pre-Training for Vietnamese Automatic Speech Recognition in
the HYKIST Project [0.0]
先住民と移民の間の言語上の困難は、特に医学領域において、日常的に共通の問題となる。
HYKISTプロジェクトの目的は、ASRとMTとの患者と医師のコミュニケーションを支援する音声翻訳システムを開発することである。
ベトナム語医学領域における会話音声認識タスクのためのASRシステムの構築について述べる。
論文 参考訳(メタデータ) (2023-09-26T21:12:09Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - Intent Identification and Entity Extraction for Healthcare Queries in
Indic Languages [16.39183257795811]
インドのような先進国では、データとリソース不足言語の技術的な制限が、医療のための高度なNLUシステムの開発に脅威をもたらしている。
本稿では、2つの異なるヘルスケアデータセットを提案する。
我々の目標は、クエリインテントを検出し、対応するエンティティを抽出することである。
論文 参考訳(メタデータ) (2023-02-19T22:53:03Z) - BioGPT: Generative Pre-trained Transformer for Biomedical Text
Generation and Mining [140.61707108174247]
本稿では,大規模生物医学文献に基づいて事前学習したドメイン固有生成型トランスフォーマー言語モデルであるBioGPTを提案する。
BC5CDRでは44.98%、38.42%、40.76%のF1スコア、KD-DTIとDDIの関係抽出タスクでは78.2%、PubMedQAでは78.2%の精度が得られた。
論文 参考訳(メタデータ) (2022-10-19T07:17:39Z) - Bengali Common Voice Speech Dataset for Automatic Speech Recognition [0.9218853132156671]
ベンガル語は世界で3億人以上の話者を抱える世界有数の言語の一つである。
その人気にもかかわらず、ベンガル音声認識システムの開発に関する研究は、多様なオープンソースデータセットが不足しているために妨げられている。
このデータセットから得られた知見を提示し、今後のバージョンで対処すべき重要な言語的課題について議論する。
論文 参考訳(メタデータ) (2022-06-28T14:52:08Z) - Challenges and Opportunities of Speech Recognition for Bengali Language [0.0]
音声認識は言語に依存したシステムであり、任意の言語の言語的・テキスト的特性に基づいて直接構築される。
ASR(Automatic Speech Recognition)システムは、現在、音声をテキストに変換するために使われている。
ベンガル語におけるASRシステムの実装は、受け入れられる状態に達していない。
論文 参考訳(メタデータ) (2021-09-27T17:38:26Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T03:34:33Z) - Domain-Specific Language Model Pretraining for Biomedical Natural
Language Processing [73.37262264915739]
バイオメディシンなどのラベルなしテキストの少ないドメインでは、スクラッチから言語モデルを事前学習することで、かなりの利益が得られることを示す。
実験の結果, ドメイン固有のプレトレーニングは, 幅広い生物医学的NLPタスクの基盤となることが明らかとなった。
論文 参考訳(メタデータ) (2020-07-31T00:04:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。