論文の概要: Development of Hybrid ASR Systems for Low Resource Medical Domain
Conversational Telephone Speech
- arxiv url: http://arxiv.org/abs/2210.13397v4
- Date: Fri, 22 Sep 2023 10:15:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-25 11:43:18.305454
- Title: Development of Hybrid ASR Systems for Low Resource Medical Domain
Conversational Telephone Speech
- Title(参考訳): 低資源医療領域会話型電話音声のためのハイブリッドasrシステムの開発
- Authors: Christoph L\"uscher and Mohammad Zeineldeen and Zijian Yang and Tina
Raissi and Peter Vieting and Khai Le-Duc and Weiyue Wang and Ralf Schl\"uter
and Hermann Ney
- Abstract要約: HYKISTプロジェクトにおいて,ドイツ語を話す医師とアラビア語またはベトナム語を話す患者とのコミュニケーションについて検討した。
HYKISTの目的は、通常非専門のバイリンガルインタプリタを自動音声翻訳システムでサポートし、患者のケアを改善し、言語障壁を克服することである。
本研究では,2つの言語対,データ収集,各種音響モデルアーキテクチャ,方言による難易度について,この会話音声翻訳タスクのためのASRシステム開発作業について述べる。
- 参考スコア(独自算出の注目度): 33.170046744835595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Language barriers present a great challenge in our increasingly connected and
global world. Especially within the medical domain, e.g. hospital or emergency
room, communication difficulties and delays may lead to malpractice and
non-optimal patient care. In the HYKIST project, we consider patient-physician
communication, more specifically between a German-speaking physician and an
Arabic- or Vietnamese-speaking patient. Currently, a doctor can call the
Triaphon service to get assistance from an interpreter in order to help
facilitate communication. The HYKIST goal is to support the usually
non-professional bilingual interpreter with an automatic speech translation
system to improve patient care and help overcome language barriers. In this
work, we present our ASR system development efforts for this conversational
telephone speech translation task in the medical domain for two languages
pairs, data collection, various acoustic model architectures and
dialect-induced difficulties.
- Abstract(参考訳): 言語障壁は、ますます接続され、グローバルな世界で大きな課題をもたらします。
特に医療分野、例えば病院や救急室では、コミュニケーションの困難と遅延により、誤治療や非最適患者のケアにつながる可能性がある。
HYKISTプロジェクトにおいて,ドイツ語を話す医師とアラビア語またはベトナム語を話す患者とのコミュニケーションについて検討した。
現在、医師はTriaphonサービスを呼び出すことで、インタプリタから助けを受け、コミュニケーションを容易にすることができる。
HYKISTの目的は、通常非専門のバイリンガルインタプリタを自動翻訳システムでサポートし、患者のケアを改善し、言語障壁を克服することである。
本研究では,2つの言語対,データ収集,様々な音響モデルアーキテクチャ,方言による難易度について,この会話音声翻訳タスクのためのASRシステム開発作業について述べる。
関連論文リスト
- GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Benchmarking Large Language Models on Communicative Medical Coaching: a Novel System and Dataset [26.504409173684653]
患者相談におけるコミュニケーションスキルの実践を支援するための,人間とAIの協調的枠組みであるChatCoachを紹介する。
ChatCoachは、医療学習者が患者エージェントと対話できるシミュレートされた環境を提供し、コーチエージェントは即時かつ構造化されたフィードバックを提供する。
我々はChatCoachフレームワーク内で、コミュニケーション型医療コーチングタスクにおいて、LLM(Large Language Models)を評価するためのデータセットを開発した。
論文 参考訳(メタデータ) (2024-02-08T10:32:06Z) - Towards a Deep Understanding of Multilingual End-to-End Speech
Translation [52.26739715012842]
我々は22言語以上で訓練された多言語エンドツーエンド音声翻訳モデルで学習した表現を解析する。
我々は分析から3つの大きな発見を得た。
論文 参考訳(メタデータ) (2023-10-31T13:50:55Z) - Unsupervised Pre-Training for Vietnamese Automatic Speech Recognition in
the HYKIST Project [0.0]
先住民と移民の間の言語上の困難は、特に医学領域において、日常的に共通の問題となる。
HYKISTプロジェクトの目的は、ASRとMTとの患者と医師のコミュニケーションを支援する音声翻訳システムを開発することである。
ベトナム語医学領域における会話音声認識タスクのためのASRシステムの構築について述べる。
論文 参考訳(メタデータ) (2023-09-26T21:12:09Z) - Talk2Care: Facilitating Asynchronous Patient-Provider Communication with
Large-Language-Model [29.982507402325396]
LLMを利用したコミュニケーションシステムTalk2Careを,高齢者と医療提供者向けに開発した。
高齢者に対しては,音声アシスタント(VA)の利便性とアクセシビリティを活用し,効果的な情報収集のためのLLMを利用したVAインタフェースを構築した。
その結果,Talk2Careはコミュニケーションプロセスを促進し,高齢者の健康情報を充実させ,提供者の努力と時間を著しく節約できることがわかった。
論文 参考訳(メタデータ) (2023-09-17T19:46:03Z) - Clinical Dialogue Transcription Error Correction using Seq2Seq Models [1.663938381339885]
臨床対話におけるASR転写誤り訂正のためのSeq2seq学習手法を提案する。
我々は、将来の研究のために公開してきたドメイン固有のデータセットを使用して、マスク満載タスクにSeq2seqモデルを微調整する。
論文 参考訳(メタデータ) (2022-05-26T18:27:17Z) - Multilingual Medical Question Answering and Information Retrieval for
Rural Health Intelligence Access [1.0499611180329804]
いくつかの発展途上国の農村部では、高品質な医療、医療インフラ、専門的診断へのアクセスはほとんど利用できない。
このような医療アクセスの欠如、患者の以前の健康記録の欠如、および先住民語での情報の置換によるいくつかの死を、容易に防ぐことができる。
本稿では,機械学習とNLP(Natural Language Processing)技術における現象の進展を利用して,低リソース・多言語・予備的ファーストポイント・オブ・コンタクト・メディカルアシスタントを設計するアプローチについて述べる。
論文 参考訳(メタデータ) (2021-06-02T16:05:24Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z) - Transforming unstructured voice and text data into insight for paramedic
emergency service using recurrent and convolutional neural networks [68.8204255655161]
救急隊員は救急車内で限られた時間内に救命判断をしなければならないことが多い。
本研究の目的は、音声とテキストデータを自動的に融合して、救急隊員に適切な状況認識情報を提供することである。
論文 参考訳(メタデータ) (2020-05-30T06:47:02Z) - That Sounds Familiar: an Analysis of Phonetic Representations Transfer
Across Languages [72.9927937955371]
我々は、他言語に存在するリソースを用いて、多言語自動音声認識モデルを訓練する。
我々は,多言語設定における全言語間での大幅な改善と,多言語設定におけるスターク劣化を観察した。
分析の結果、ひとつの言語に固有の電話でさえ、他の言語からのトレーニングデータを追加することで大きなメリットがあることがわかった。
論文 参考訳(メタデータ) (2020-05-16T22:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。