論文の概要: BPQA Dataset: Evaluating How Well Language Models Leverage Blood Pressures to Answer Biomedical Questions
- arxiv url: http://arxiv.org/abs/2503.04155v1
- Date: Thu, 06 Mar 2025 07:06:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 16:00:22.901589
- Title: BPQA Dataset: Evaluating How Well Language Models Leverage Blood Pressures to Answer Biomedical Questions
- Title(参考訳): BPQAデータセット: バイオメディカル質問に対する言語モデルによる血圧評価
- Authors: Chi Hang, Ruiqi Deng, Lavender Yao Jiang, Zihao Yang, Anton Alyakin, Daniel Alber, Eric Karl Oermann,
- Abstract要約: トランスフォーマーベース言語モデル(LM)が臨床的測定を効果的に解釈し利用できるかどうかは不明である。
新たに開発したBPQA(Blood Pressure Question Answering)を用いて,BERT,BioBERT,MedAlpaca,GPT-3.5の4種類のLMの性能評価を行った。
GPT-3.5およびMedAlpaca(大型・中型LM)はBERTおよびBioBERTよりもBPsが有効であることがわかった。
- 参考スコア(独自算出の注目度): 1.8352916317942294
- License:
- Abstract: Clinical measurements such as blood pressures and respiration rates are critical in diagnosing and monitoring patient outcomes. It is an important component of biomedical data, which can be used to train transformer-based language models (LMs) for improving healthcare delivery. It is, however, unclear whether LMs can effectively interpret and use clinical measurements. We investigate two questions: First, can LMs effectively leverage clinical measurements to answer related medical questions? Second, how to enhance an LM's performance on medical question-answering (QA) tasks that involve measurements? We performed a case study on blood pressure readings (BPs), a vital sign routinely monitored by medical professionals. We evaluated the performance of four LMs: BERT, BioBERT, MedAlpaca, and GPT-3.5, on our newly developed dataset, BPQA (Blood Pressure Question Answering). BPQA contains $100$ medical QA pairs that were verified by medical students and designed to rely on BPs . We found that GPT-3.5 and MedAlpaca (larger and medium sized LMs) benefit more from the inclusion of BPs than BERT and BioBERT (small sized LMs). Further, augmenting measurements with labels improves the performance of BioBERT and Medalpaca (domain specific LMs), suggesting that retrieval may be useful for improving domain-specific LMs.
- Abstract(参考訳): 血圧や呼吸速度などの臨床測定は、患者の結果の診断とモニタリングに重要である。
バイオメディカルデータの重要なコンポーネントであり、トランスフォーマーベースの言語モデル(LM)をトレーニングして、医療提供を改善するために使用することができる。
しかし、LMが臨床的測定を効果的に解釈し利用できるかどうかは不明である。
まず、LMは臨床測定を効果的に活用して関連する医学的疑問に答えられるか?
第2に、測定を含むQAタスクにおけるLMのパフォーマンスを向上させるには、どうすればよいか?
血圧測定(BPs)は,医療従事者が日常的に観察する重要な指標である。
新たに開発したBPQA(Blood Pressure Question Answering)を用いて,BERT,BioBERT,MedAlpaca,GPT-3.5の4種類のLMの性能評価を行った。
BPQAには、医療学生によって検証され、BPに依存するように設計された100ドルの医療QAペアが含まれている。
GPT-3.5 と MedAlpaca は BPs を BERT や BioBERT (小径LMs) よりも有益であることがわかった。
さらに,ラベルを用いた計測により,BioBERTとMarypaca(ドメイン固有LM)の性能が向上し,検索がドメイン固有LMの改善に有用である可能性が示唆された。
関連論文リスト
- Towards Evaluating and Building Versatile Large Language Models for Medicine [57.49547766838095]
MedS-Benchは大規模言語モデル(LLM)の性能を臨床的に評価するためのベンチマークである。
MedS-Benchは、臨床報告の要約、治療勧告、診断、名前付きエンティティ認識、医療概念説明を含む、11のハイレベルな臨床タスクにまたがる。
MedS-Insは58の医療指向言語コーパスで構成され、112のタスクで1350万のサンプルを収集している。
論文 参考訳(メタデータ) (2024-08-22T17:01:34Z) - Large Language Models for Cuffless Blood Pressure Measurement From Wearable Biosignals [14.216163316714285]
大規模言語モデル(LLM)を用いてウェアラブルバイオシグナーを分析し,カフレス血圧(BP)測定を行った。
本稿では,ウェアラブルバイオシグナーを用いたカフレスBP推定のためのLCMのキャパシティを初めて検討する。
提案手法を評価するために,1,272人のウェアラブルバイオシグナーの包括的公開データセットを用いて,10種類の高度なLCMの評価を行った。
論文 参考訳(メタデータ) (2024-06-26T04:54:45Z) - BMRetriever: Tuning Large Language Models as Better Biomedical Text Retrievers [48.21255861863282]
BMRetrieverは、バイオメディカル検索を強化するための一連の密集したレトリバーである。
BMRetrieverは強力なパラメータ効率を示し、410Mの派生型はベースラインを最大11.7倍まで上回っている。
論文 参考訳(メタデータ) (2024-04-29T05:40:08Z) - Exploring the limitations of blood pressure estimation using the photoplethysmography signal [0.0]
光プレモグラフィ(N-シメセ)と浸潤動脈血圧(N-IABP)を比較検討した。
N-IABP信号は、SBP(Systolic blood pressure)およびDBP(Distolic blood pressure)のAAMI標準に合致する
BP推定におけるPSGの有用性と限界について検討した。
論文 参考訳(メタデータ) (2024-04-09T14:08:23Z) - BioMedLM: A 2.7B Parameter Language Model Trained On Biomedical Text [82.7001841679981]
BioMedLM は270億のパラメータ GPT スタイルの自己回帰モデルであり、PubMed の抽象概念と全記事に特化して訓練されている。
微調整すると、BioMedLMはより大規模なモデルと競合する強力な多重選択のバイオメディカルな質問応答結果を生成することができる。
BioMedLMは、医療トピックに関する患者の質問に対する有用な回答を生成するために、微調整することもできる。
論文 参考訳(メタデータ) (2024-03-27T10:18:21Z) - Leveraging Large Language Models for Analyzing Blood Pressure Variations
Across Biological Sex from Scientific Literature [3.731841514150172]
高血圧は正常以上の血圧(BP)と定義され、公衆衛生の領域において最も重要である。
既存のBP測定技術と標準は、臨床結果、共同性、または人口統計因子を考慮していないため、バイアスを受ける可能性がある。
大規模言語モデル (LLM) である GPT-35-turbo を用いて, BP の平均偏差値と標準偏差値を自動的に抽出した。
論文 参考訳(メタデータ) (2024-02-02T18:15:51Z) - MEDITRON-70B: Scaling Medical Pretraining for Large Language Models [91.25119823784705]
大きな言語モデル(LLM)は、医療知識へのアクセスを民主化することができる。
医療領域に適応した7Bおよび70BパラメータのオープンソースLLMスイートであるMEDITRONをリリースする。
論文 参考訳(メタデータ) (2023-11-27T18:49:43Z) - Augmenting Black-box LLMs with Medical Textbooks for Biomedical Question Answering [48.17095875619711]
LLMs Augmented with Medical Textbooks (LLM-AMT)を提案する。
LLM-AMTは、プラグイン・アンド・プレイモジュールを使用して、権威ある医学教科書をLLMのフレームワークに統合する。
検索コーパスとしての医学教科書は,医学領域におけるウィキペディアよりも効果的な知識データベースであることが確認された。
論文 参考訳(メタデータ) (2023-09-05T13:39:38Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - A Survey on Blood Pressure Measurement Technologies: Addressing
Potential Sources of Bias [4.0527913281804135]
血圧モニタリング(BP)は、心臓血管疾患の予防、診断、治療、管理において重要な役割を担っている。
最近のガイドラインでは、定期的な臨床訪問や自宅でのBPモニタリングが推奨されている。
BP測定は、測定やデバイスエラー、人口統計、身体習慣などの要因によって、かなりのバイアスとばらつきを示す可能性がある。
論文 参考訳(メタデータ) (2023-06-14T11:51:11Z) - Continuous Monitoring of Blood Pressure with Evidential Regression [19.92542487970484]
光胸腺X線写真(MIC)信号を用いた血圧推定は,最新のBP測定の候補として期待できる。
提案手法は,不確実性を推定し,医療状態の診断に役立てることにより,予測BPの信頼性を提供する。
論文 参考訳(メタデータ) (2021-02-06T09:09:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。