論文の概要: AsthmaBot: Multi-modal, Multi-Lingual Retrieval Augmented Generation For Asthma Patient Support
- arxiv url: http://arxiv.org/abs/2409.15815v1
- Date: Tue, 24 Sep 2024 07:24:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 08:41:18.843652
- Title: AsthmaBot: Multi-modal, Multi-Lingual Retrieval Augmented Generation For Asthma Patient Support
- Title(参考訳): AsthmaBot: 喘息患者支援のためのマルチモーダル多言語検索世代
- Authors: Adil Bahaj, Mounir Ghogho,
- Abstract要約: 喘息率は、環境やライフスタイルの要因によって、世界中で増加している。
即時医療へのアクセスは、特に発展途上国では限られている。
AsthmaBotは、喘息支援のための多言語・多モーダル検索拡張生成システムである。
- 参考スコア(独自算出の注目度): 3.542013483233133
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Asthma rates have risen globally, driven by environmental and lifestyle factors. Access to immediate medical care is limited, particularly in developing countries, necessitating automated support systems. Large Language Models like ChatGPT (Chat Generative Pre-trained Transformer) and Gemini have advanced natural language processing in general and question answering in particular, however, they are prone to producing factually incorrect responses (i.e. hallucinations). Retrieval-augmented generation systems, integrating curated documents, can improve large language models' performance and reduce the incidence of hallucination. We introduce AsthmaBot, a multi-lingual, multi-modal retrieval-augmented generation system for asthma support. Evaluation of an asthma-related frequently asked questions dataset shows AsthmaBot's efficacy. AsthmaBot has an added interactive and intuitive interface that integrates different data modalities (text, images, videos) to make it accessible to the larger public. AsthmaBot is available online via \url{asthmabot.datanets.org}.
- Abstract(参考訳): 喘息率は、環境やライフスタイルの要因によって、世界中で増加している。
即時医療へのアクセスは、特に発展途上国では、自動支援システムを必要とする。
ChatGPT(Chat Generative Pre-trained Transformer)やGemini(英語版)のような大規模言語モデルは、自然言語処理全般を進歩させ、特に疑問に答える。
検索用拡張生成システムは、キュレートされた文書を統合することで、大規模言語モデルの性能を改善し、幻覚の発生を減少させることができる。
喘息支援のための多言語・多モーダル検索拡張生成システムであるAsthmaBotを紹介する。
喘息関連質問データセットの評価は喘息ボットの有効性を示す。
AsthmaBotにはインタラクティブで直感的なインターフェースがあり、さまざまなデータモダリティ(テキスト、画像、ビデオ)を統合して、一般大衆にアクセスできるようにする。
AsthmaBot は \url{asthmabot.datanets.org} を通じてオンラインで入手できる。
関連論文リスト
- MultiMed: Multilingual Medical Speech Recognition via Attention Encoder Decoder [1.220481237642298]
MultiMedは、医療分野向けの小型から大規模のASRモデルのコレクションである。
医学的ASRにおける多言語性に関する初の再現可能な研究であり、エンドツーエンドのASRトレーニングのための階層的アブレーション研究を行い、多言語医学的ASRのための最初の言語学的分析を提供する。
論文 参考訳(メタデータ) (2024-09-21T09:05:48Z) - MING-MOE: Enhancing Medical Multi-Task Learning in Large Language Models with Sparse Mixture of Low-Rank Adapter Experts [22.596827147978598]
本稿では,MING-MOE(Mixture-of-Expert)をベースとした医療用大規模言語モデルを提案する。
タスク固有のアノテーションを必要とせずに、多種多様な複雑な医療タスクを管理するように設計されている。
20以上の医療タスクで最先端(SOTA)のパフォーマンスを達成し、既存のモデルよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-04-13T15:28:52Z) - Unsupervised Pre-Training for Vietnamese Automatic Speech Recognition in
the HYKIST Project [0.0]
先住民と移民の間の言語上の困難は、特に医学領域において、日常的に共通の問題となる。
HYKISTプロジェクトの目的は、ASRとMTとの患者と医師のコミュニケーションを支援する音声翻訳システムを開発することである。
ベトナム語医学領域における会話音声認識タスクのためのASRシステムの構築について述べる。
論文 参考訳(メタデータ) (2023-09-26T21:12:09Z) - Med-Flamingo: a Multimodal Medical Few-shot Learner [58.85676013818811]
医療領域に適応したマルチモーダル・数ショット学習者であるMed-Flamingoを提案する。
OpenFlamingo-9Bに基づいて、出版物や教科書からの医療画像テキストデータのペア化とインターリーブ化を継続する。
本研究は,医療用VQA(ジェネレーティブ医療用VQA)の最初の人間評価である。
論文 参考訳(メタデータ) (2023-07-27T20:36:02Z) - Multilingual Simplification of Medical Texts [49.469685530201716]
4つの言語で医療領域のための文章整列型多言語テキスト単純化データセットであるMultiCochraneを紹介する。
これらの言語にまたがる微調整およびゼロショットモデルの評価を行い,人間による評価と分析を行った。
モデルは、実行可能な単純化されたテキストを生成することができるが、このデータセットが扱う可能性のある、卓越した課題を特定する。
論文 参考訳(メタデータ) (2023-05-21T18:25:07Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Patient-specific modelling, simulation and real-time processing for
respiratory diseases [0.0]
喘息は呼吸系の慢性疾患であり、大きな障害と社会的負担を引き起こす。
世界の人口は3億人を超え、2025年までには1億人以上が喘息を患うだろう。
論文 参考訳(メタデータ) (2022-07-03T17:30:36Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Parameter-Efficient Neural Reranking for Cross-Lingual and Multilingual
Retrieval [66.69799641522133]
最先端のニューラルランカーは、お腹が空いていることで悪名高い。
現在のアプローチでは、英語データに基づいて訓練されたローダを、多言語エンコーダを用いて他の言語や言語間設定に転送するのが一般的である。
本研究では,Sparse Fine-Tuning Masks (SFTMs) とAdapters (Adapters) の2つのパラメータ効率のアプローチにより,より軽量で効果的なゼロショット転送が可能となることを示す。
論文 参考訳(メタデータ) (2022-04-05T15:44:27Z) - Building a Decision Support System for Automated Mobile Asthma
Monitoring in Remote Areas [0.0]
本稿では,運動によって引き起こされた喘息の早期症状を捉え解析するために,内蔵センサを搭載したスマートフォンを用いた。
予備的な結果は、スマートフォンが他のネットワークデバイスを使わずに喘息症状をモニターし、検出することができることを示している。
論文 参考訳(メタデータ) (2021-12-11T14:18:08Z) - A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker
Identity in Dysarthric Voice Conversion [50.040466658605524]
変形性音声変換(DVC)における話者同一性維持のための新しいパラダイムを提案する。
変形性音声の質は統計VCによって大幅に改善される。
しかし, 変形性関節症患者の通常の発話は, ほとんど収集できないため, 過去の研究は患者の個性を取り戻すことはできなかった。
論文 参考訳(メタデータ) (2021-06-02T18:41:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。