論文の概要: Integrating automatic speech recognition into remote healthcare interpreting: A pilot study of its impact on interpreting quality
- arxiv url: http://arxiv.org/abs/2502.03381v1
- Date: Wed, 05 Feb 2025 17:17:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:27:37.125300
- Title: Integrating automatic speech recognition into remote healthcare interpreting: A pilot study of its impact on interpreting quality
- Title(参考訳): 遠隔医療解釈への自動音声認識の統合:その品質解釈への影響に関するパイロット研究
- Authors: Shiyi Tan, Constantin Orăsan, Sabine Braun,
- Abstract要約: 本稿では,遠隔医療における音声認識(ASR)が品質の解釈に与える影響について,パイロット研究の結果について報告する。
4人のインタプリタと中国語と英語の組み合わせを含む。
予備的なデータは、ASR、特に完全なASR転写文字と、ASRに基づくChatGPT生成サマリへのアクセスが有効であることを示し、効果的に解釈品質を改善した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper reports on the results from a pilot study investigating the impact of automatic speech recognition (ASR) technology on interpreting quality in remote healthcare interpreting settings. Employing a within-subjects experiment design with four randomised conditions, this study utilises scripted medical consultations to simulate dialogue interpreting tasks. It involves four trainee interpreters with a language combination of Chinese and English. It also gathers participants' experience and perceptions of ASR support through cued retrospective reports and semi-structured interviews. Preliminary data suggest that the availability of ASR, specifically the access to full ASR transcripts and to ChatGPT-generated summaries based on ASR, effectively improved interpreting quality. Varying types of ASR output had different impacts on the distribution of interpreting error types. Participants reported similar interactive experiences with the technology, expressing their preference for full ASR transcripts. This pilot study shows encouraging results of applying ASR to dialogue-based healthcare interpreting and offers insights into the optimal ways to present ASR output to enhance interpreter experience and performance. However, it should be emphasised that the main purpose of this study was to validate the methodology and that further research with a larger sample size is necessary to confirm these findings.
- Abstract(参考訳): 本稿では,遠隔医療における音声認識技術(ASR)が品質の解釈に与える影響について,パイロット研究の結果について報告する。
本研究は, 4つのランダム化条件を持つイントラオブジェクト実験設計を用いて, 対話解釈タスクをシミュレートするために, スクリプト化された医療相談を利用する。
4人のインタプリタと中国語と英語の組み合わせを含む。
また、参加者のASRサポートに関する経験や認識を、ふりかえりの報告や半構造化されたインタビューを通じて収集する。
予備的なデータは、ASR、特に完全なASR転写文字と、ASRに基づくChatGPT生成サマリへのアクセスが有効であることを示し、効果的に解釈品質を改善した。
ASR出力の変数型は、解釈エラー型の分布に異なる影響を及ぼした。
参加者は同様のインタラクティブな体験を報告し、完全なASRの書き起こしを好んだ。
このパイロットスタディは、対話型医療解釈にASRを適用した結果を奨励し、インタプリタの経験とパフォーマンスを高めるために、ASR出力を提示する最適な方法に関する洞察を提供する。
しかし,本研究の主な目的は方法論を検証することであり,さらに試料径の大きい研究が必要である点に留意する必要がある。
関連論文リスト
- Towards interfacing large language models with ASR systems using confidence measures and prompting [54.39667883394458]
本研究では,大言語モデル(LLM)を用いたASRテキストのポストホック修正について検討する。
精度の高い転写文に誤りを導入することを避けるため,信頼度に基づくフィルタリング手法を提案する。
その結果,競争力の低いASRシステムの性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-07-31T08:00:41Z) - Speech Emotion Recognition with ASR Transcripts: A Comprehensive Study on Word Error Rate and Fusion Techniques [17.166092544686553]
本研究では,3つのよく知られたコーパス上の11種類のモデルから,単語誤り率(WER)の異なるASR文字を用いた音声感情認識のベンチマークを行った。
本稿では, ASR 誤り訂正とモダリティゲート融合を統合した ASR 誤り処理フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-12T15:59:25Z) - The Balancing Act: Unmasking and Alleviating ASR Biases in Portuguese [5.308321515594125]
本研究は,Whisper および MMS システムの総合的な探索を目的としたものである。
調査対象は性別,年齢,肌の色,位置情報など多岐にわたる。
オーバーサンプリング技術がこのようなステレオタイプバイアスを軽減することを実証的に示す。
論文 参考訳(メタデータ) (2024-02-12T09:35:13Z) - Label Aware Speech Representation Learning For Language Identification [49.197215416945596]
本稿では,自己指導型表現学習と事前学習タスクのための言語ラベル情報を組み合わせた新しいフレームワークを提案する。
このフレームワークは、ラベル認識音声表現(LASR)学習と呼ばれ、三重項に基づく目的関数を使用して、言語ラベルと自己教師付き損失関数を組み込む。
論文 参考訳(メタデータ) (2023-06-07T12:14:16Z) - An ASR-Based Tutor for Learning to Read: How to Optimize Feedback to
First Graders [18.849741353784328]
前報では,ASRをベースとしたオランダ語読解指導アプリケーションについて紹介し,初等生の読み方に対する即時フィードバックについて検討した。
既存のコーパス (JASMIN) から得られた子どもの音声を用いて, 2つの新しいASRシステムの開発を行い, 前報と比較した。
ASRシステムの精度は、読み出しタスクや単語の種類によって異なる。
論文 参考訳(メタデータ) (2023-06-07T06:58:38Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - Fusing ASR Outputs in Joint Training for Speech Emotion Recognition [14.35400087127149]
共同学習音声認識(SER)のためのパイプラインに自動音声認識(ASR)出力を融合する手法を提案する。
共同ASR-SERトレーニングでは、階層的コアテンション融合アプローチを用いて、ASRとテキストの出力の両方を組み込むことで、SERの性能が向上する。
また,IEMOCAPにおける単語誤り率解析や,ASRとSERの関係をよりよく理解するために,Wav2vec 2.0モデルの層差解析も提案する。
論文 参考訳(メタデータ) (2021-10-29T11:21:17Z) - Contextualized Attention-based Knowledge Transfer for Spoken
Conversational Question Answering [63.72278693825945]
音声対話型質問応答 (SCQA) は複雑な対話の流れをモデル化するために機械を必要とする。
本稿では,新しい文脈型注意型蒸留手法CADNetを提案する。
Spoken-CoQAデータセット上で広範な実験を行い、本手法が優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-10-21T15:17:18Z) - Dialogue-Based Relation Extraction [53.2896545819799]
本稿では,人間による対話型関係抽出(RE)データセットDialogREを提案する。
我々は,対話型タスクと従来のREタスクの類似点と相違点の分析に基づいて,提案課題において話者関連情報が重要な役割を担っていると論じる。
実験結果から,ベストパフォーマンスモデルにおける話者認識の拡張が,標準設定と会話評価設定の両方において向上することが示された。
論文 参考訳(メタデータ) (2020-04-17T03:51:57Z) - Improving Readability for Automatic Speech Recognition Transcription [50.86019112545596]
我々は、可読性のためのASRポストプロセッシング(APR)と呼ばれる新しいNLPタスクを提案する。
APRは、ノイズの多いASR出力を、話者の意味を保ちながら、人間や下流タスクのための読みやすいテキストに変換することを目的としている。
我々は,いくつかのオープンソースモデルと適応型事前学習モデルに基づく微調整モデルと,従来のパイプライン手法との比較を行った。
論文 参考訳(メタデータ) (2020-04-09T09:26:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。