論文の概要: Cancer Vaccine Adjuvant Name Recognition from Biomedical Literature using Large Language Models
- arxiv url: http://arxiv.org/abs/2502.09659v1
- Date: Wed, 12 Feb 2025 06:30:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 14:48:51.761158
- Title: Cancer Vaccine Adjuvant Name Recognition from Biomedical Literature using Large Language Models
- Title(参考訳): 大規模言語モデルを用いたバイオメディカル文献からの癌ワクチンのアジュバント名認識
- Authors: Hasin Rehana, Jie Zheng, Leo Yeh, Benu Bansal, Nur Bengisu Çam, Christianah Jemiyo, Brett McGregor, Arzucan Özgür, Yongqun He, Junguk Hur,
- Abstract要約: アジュバント(adjuvant)は、免疫反応を改善することにより効果を高めるワクチンに組み込まれた化学物質である。
本研究では,Large Language Models(LLMs),特にGenerative Pretrained Transformers(GPT)とLlama(Large Language Model Meta AI)を用いて,ワクチンのアジュバント名の自動認識について検討する。
- 参考スコア(独自算出の注目度): 3.582740629030056
- License:
- Abstract: Motivation: An adjuvant is a chemical incorporated into vaccines that enhances their efficacy by improving the immune response. Identifying adjuvant names from cancer vaccine studies is essential for furthering research and enhancing immunotherapies. However, the manual curation from the constantly expanding biomedical literature poses significant challenges. This study explores the automated recognition of vaccine adjuvant names using Large Language Models (LLMs), specifically Generative Pretrained Transformers (GPT) and Large Language Model Meta AI (Llama). Methods: We utilized two datasets: 97 clinical trial records from AdjuvareDB and 290 abstracts annotated with the Vaccine Adjuvant Compendium (VAC). GPT-4o and Llama 3.2 were employed in zero-shot and few-shot learning paradigms with up to four examples per prompt. Prompts explicitly targeted adjuvant names, testing the impact of contextual information such as substances or interventions. Outputs underwent automated and manual validation for accuracy and consistency. Results: GPT-4o attained 100% Precision across all situations while exhibiting notable improve in Recall and F1-scores, particularly with incorporating interventions. On the VAC dataset, GPT-4o achieved a maximum F1-score of 77.32% with interventions, surpassing Llama-3.2-3B by approximately 2%. On the AdjuvareDB dataset, GPT-4o reached an F1-score of 81.67% for three-shot prompting with interventions, surpassing Llama-3.2-3 B's maximum F1-score of 65.62%. Conclusion: Our findings demonstrate that LLMs excel at identifying adjuvant names, including rare variations of naming representation. This study emphasizes the capability of LLMs to enhance cancer vaccine development by efficiently extracting insights. Future work aims to broaden the framework to encompass various biomedical literature and enhance model generalizability across various vaccines and adjuvants.
- Abstract(参考訳): モチベーション(Motivation):アジュバント(adjuvant)は、免疫反応を改善することで効果を高めるワクチンに組み込まれた化学物質である。
がんワクチン研究からアジュバント名を同定することは、研究の促進と免疫療法の強化に不可欠である。
しかし、絶え間なく拡大する生体医学文献からの手作業によるキュレーションは、大きな課題を招いている。
本研究では,Large Language Models(LLMs),特にGenerative Pretrained Transformers(GPT)とLlama(Large Language Model Meta AI)を用いて,ワクチンのアジュバント名の自動認識について検討する。
方法:AdjuvareDBによる97の臨床試験記録とVacine Adjuvant Compendium (VAC)に注釈を付した290の抄録を用いた。
GPT-4oとLlama 3.2は0ショットと数ショットの学習パラダイムに採用され、1プロンプトあたり最大4つの例がある。
プロンプトは明らかにアジュバントの名前をターゲットにし、物質や介入などの文脈情報の影響をテストした。
アウトプットは精度と一貫性の検証と手動で行う。
結果: GPT-4oはすべての状況において100%精度を達成し, リコールとF1スコアの著明な改善, 特に介入を取り入れた。
VACデータセットでは、GPT-4oは最大F1スコア77.32%の介入を達成し、Llama-3.2-3Bを約2%上回った。
AdjuvareDBデータセットでは、GPT-4oのF1スコアは81.67%に達し、介入によってLlama-3.2-3 Bの最大F1スコアは65.62%を超えた。
結論: LLMは,命名表現の稀なバリエーションを含む,アジュバントな名前の同定に優れていた。
本研究は, 効率よく洞察を抽出し, がんワクチン開発を促進するLLMの能力を強調した。
今後の研究は、様々な生物医学文献を網羅する枠組みを広げ、様々なワクチンや補助剤のモデル一般化性を高めることを目的としている。
関連論文リスト
- MGH Radiology Llama: A Llama 3 70B Model for Radiology [50.42811030970618]
本稿では,高度な放射線学に焦点を当てた大規模言語モデルMGH Radiology Llamaを提案する。
Llama 3 70Bモデルを使用して開発され、Radiology-GPTやRadiology-Llama2といった従来のドメイン固有モデルをベースにしている。
従来の指標とGPT-4に基づく評価の両方を取り入れた評価では,汎用LLMよりも高い性能を示す。
論文 参考訳(メタデータ) (2024-08-13T01:30:03Z) - GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.09501109871351]
LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文 参考訳(メタデータ) (2024-08-06T17:59:21Z) - Improving Entity Recognition Using Ensembles of Deep Learning and Fine-tuned Large Language Models: A Case Study on Adverse Event Extraction from Multiple Sources [13.750202656564907]
副作用イベント(AE)抽出は、免疫の安全プロファイルを監視し解析するために重要である。
本研究では,AE抽出における大規模言語モデル(LLM)と従来のディープラーニングモデルの有効性を評価することを目的とする。
論文 参考訳(メタデータ) (2024-06-26T03:56:21Z) - COVID-19 Vaccine Misinformation in Middle Income Countries [5.891662430960944]
本稿では、中所得国であるブラジル、インドネシア、ナイジェリアの3カ国からの注釈付きツイートからなる、新型コロナウイルスワクチン誤報の多言語データセットについて紹介する。
データセットには、5,952ツイートのアノテーション、新型コロナウイルスワクチンとの関連性、誤情報の存在、誤情報のテーマなどが含まれている。
論文 参考訳(メタデータ) (2023-11-30T02:27:34Z) - AE-GPT: Using Large Language Models to Extract Adverse Events from
Surveillance Reports-A Use Case with Influenza Vaccine Adverse Events [13.221548807536067]
大言語モデル (LLMs) は臨床報告の中でAEを効果的に同定しカタログ化する可能性を示唆している。
本研究では特に,ALMのAE抽出能力を評価するためのAEに焦点を当てた。
微調整 GPT 3.5 モデル (AE-GPT) は0.704 マイクロ F1 スコアを厳密な試合、0.816 スコアを緩和した。
論文 参考訳(メタデータ) (2023-09-28T03:53:21Z) - CORAL: Expert-Curated medical Oncology Reports to Advance Language Model
Inference [2.1067045507411195]
大規模言語モデル(LLM)は、最近、様々な医学自然言語処理タスクにおいて印象的なパフォーマンスを示した。
そこで我々は, 患者の特徴, 腫瘍の特徴, 検査, 治療, 時間性などを含む, テキストオンコロジー情報に注釈を付けるための詳細なスキーマを開発した。
GPT-4モデルでは、BLEUスコアが平均0.73、ROUGEスコアが平均0.72、F1スコアが0.51、複雑なタスクが平均68%であった。
論文 参考訳(メタデータ) (2023-08-07T18:03:10Z) - A Stitch in Time Saves Nine: Detecting and Mitigating Hallucinations of
LLMs by Validating Low-Confidence Generation [76.34411067299331]
大規模な言語モデルは、しばしば信頼性を著しく損なう「ハロシン化」する傾向がある。
生成過程における幻覚を積極的に検出・緩和する手法を提案する。
提案手法は, GPT-3.5モデルの幻覚を平均47.5%から14.5%に低減する。
論文 参考訳(メタデータ) (2023-07-08T14:25:57Z) - Dense Feature Memory Augmented Transformers for COVID-19 Vaccination
Search Classification [60.49594822215981]
本稿では,新型コロナウイルスワクチン関連検索クエリの分類モデルを提案する。
本稿では,モデルが対応可能なメモリトークンとして,高密度特徴を考慮した新しい手法を提案する。
この新しいモデリング手法により,Vaccine Search Insights (VSI) タスクを大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-12-16T13:57:41Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。