論文の概要: Real-time Speech Summarization for Medical Conversations
- arxiv url: http://arxiv.org/abs/2406.15888v1
- Date: Sat, 22 Jun 2024 16:37:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 20:03:15.659338
- Title: Real-time Speech Summarization for Medical Conversations
- Title(参考訳): 医療会話におけるリアルタイム音声要約
- Authors: Khai Le-Duc, Khai-Nguyen Nguyen, Long Vo-Dang, Truong-Son Hy,
- Abstract要約: 医師と患者の会話では、医療関連情報の特定が重要である。
本稿では,産業における実世界のアプリケーションを対象とした,初めてのリアルタイム音声要約システムを提案する。
医療会話のための最初の音声要約データセットであるVietMed-Sumを提示する。
- 参考スコア(独自算出の注目度): 1.387448620257867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In doctor-patient conversations, identifying medically relevant information is crucial, posing the need for conversation summarization. In this work, we propose the first deployable real-time speech summarization system for real-world applications in industry, which generates a local summary after every N speech utterances within a conversation and a global summary after the end of a conversation. Our system could enhance user experience from a business standpoint, while also reducing computational costs from a technical perspective. Secondly, we present VietMed-Sum which, to our knowledge, is the first speech summarization dataset for medical conversations. Thirdly, we are the first to utilize LLM and human annotators collaboratively to create gold standard and synthetic summaries for medical conversation summarization. Finally, we present baseline results of state-of-the-art models on VietMed-Sum. All code, data (English-translated and Vietnamese) and models are available online: https://github.com/leduckhai/MultiMed
- Abstract(参考訳): 医師と患者の会話では、医学的な関連情報を特定することが重要であり、会話の要約の必要性を浮き彫りにする。
本研究では,業界における実世界のアプリケーションを対象とした最初のリアルタイム音声要約システムを提案する。このシステムは,会話中のN音声の発話毎に局所的な要約を生成し,会話終了後にグローバルな要約を生成する。
当社のシステムでは,ビジネスの観点からユーザエクスペリエンスを向上させると同時に,技術的観点から計算コストを削減できる。
第二に、VietMed-Sumは医療会話のための最初の音声要約データセットである。
第3に、医療会話要約のための金標準および合成要約を作成するために、LSMとヒトアノテーションを協調的に利用した最初の人物である。
最後に、VietMed-Sum上での最先端モデルのベースライン結果を示す。
すべてのコード、データ(英訳、ベトナム語)、モデルはオンラインで入手できる。
関連論文リスト
- Two eyes, Two views, and finally, One summary! Towards Multi-modal Multi-tasking Knowledge-Infused Medical Dialogue Summarization [12.953002469651938]
医学的懸念, 医師の印象, 全体像の要約を同時に生成する多面的アプローチの有効性について検討した。
マルチモーダル・マルチタスク・知識注入型医療対話要約生成モデル(MMK-Summation)を提案する。
モデルMMK-Summationは、対話を入力として取り、コンテキストに基づいて関連する外部知識を抽出し、対話から知識と視覚的手がかりをテキストコンテンツに統合し、最終的には簡潔な要約を生成する。
論文 参考訳(メタデータ) (2024-07-21T18:00:10Z) - MedSumm: A Multimodal Approach to Summarizing Code-Mixed Hindi-English
Clinical Queries [16.101969130235055]
本稿では,Multimodal Medical Codemixed Question Summarization MMCQSデータセットを紹介する。
このデータセットは、ヒンディー語と英語の混成医療クエリと視覚支援を組み合わせたものだ。
データセット、コード、トレーニング済みのモデルを公開します。
論文 参考訳(メタデータ) (2024-01-03T07:58:25Z) - Toward Joint Language Modeling for Speech Units and Text [89.32163954508489]
音声単位とテキストの共用言語モデリングについて検討する。
音声とテキストの混在度を評価するための自動計測手法を提案する。
提案手法を用いて音声単位とテキストを混合することにより,SLUタスクにおける音声のみのベースラインを改良することを示す。
論文 参考訳(メタデータ) (2023-10-12T20:53:39Z) - LLaVA-Med: Training a Large Language-and-Vision Assistant for
Biomedicine in One Day [85.19963303642427]
本稿では,バイオメディカルイメージのオープンな研究課題に答えられる視覚言語対話アシスタントを訓練するための費用効率のよいアプローチを提案する。
モデルはまず、フィギュア・キャプションのペアを使ってバイオメディカル・ボキャブラリをアライメントし、その後、オープンエンドの会話意味論を習得する。
これにより、バイオメディジンのための大規模言語と視覚アシスタントを15時間以内で(8つのA100で)訓練することができる。
論文 参考訳(メタデータ) (2023-06-01T16:50:07Z) - Generating medically-accurate summaries of patient-provider dialogue: A
multi-stage approach using large language models [6.252236971703546]
効果的な要約は、対話におけるすべての医学的関連情報を一貫性と精度良く捉えることが要求される。
本稿では, 医療会話の要約問題に, タスクを, より小さな対話に基づくタスクに分解することで対処する。
論文 参考訳(メタデータ) (2023-05-10T08:48:53Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - MasonNLP+ at SemEval-2023 Task 8: Extracting Medical Questions,
Experiences and Claims from Social Media using Knowledge-Augmented
Pre-trained Language Models [0.0]
Redditのようなオンラインフォーラムでは、ユーザーは、クレームの作成、質問、治療が健康に与える影響について議論など、医療状況や治療経験を共有している。
この情報を理解するシステムの構築は、誤報の拡散を効果的に監視し、ユーザのクレームを検証する。
2023年「セマンティック・アセスメントに関する国際ワークショップ」のタスク8は、ソーシャルメディア上のユーザー投稿から患者体験・医療状況関連エンティティを抽出する医療応用に焦点を当てた。
論文 参考訳(メタデータ) (2023-04-26T23:45:11Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - MedDG: An Entity-Centric Medical Consultation Dataset for Entity-Aware
Medical Dialogue Generation [86.38736781043109]
MedDGという12種類の消化器疾患に関連する大規模医用対話データセットを構築し,公開する。
MedDGデータセットに基づく2種類の医療対話タスクを提案する。1つは次のエンティティ予測であり、もう1つは医師の反応生成である。
実験結果から,プレトレイン言語モデルと他のベースラインは,両方のタスクに苦戦し,データセットの性能が劣ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T03:34:33Z) - Dr. Summarize: Global Summarization of Medical Dialogue by Exploiting
Local Structures [4.3012765978447565]
本稿では,患者の医療履歴を収集する際,一意で独立した局所構造を生かした医療会話要約手法を提案する。
提案手法は,ベースラインポインタジェネレータモデルに対するポインタ数を2倍にし,会話の80%で情報の大部分あるいは全部をキャプチャする。
論文 参考訳(メタデータ) (2020-09-18T07:35:44Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。