論文の概要: Validating Pharmacogenomics Generative Artificial Intelligence Query Prompts Using Retrieval-Augmented Generation (RAG)
- arxiv url: http://arxiv.org/abs/2507.21453v1
- Date: Tue, 29 Jul 2025 02:43:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.561655
- Title: Validating Pharmacogenomics Generative Artificial Intelligence Query Prompts Using Retrieval-Augmented Generation (RAG)
- Title(参考訳): Retrieval-Augmented Generation (RAG) を用いた創発的人工知能クエリの検証
- Authors: Ashley Rector, Keaton Minor, Kamden Minor, Jeff McCormack, Beth Breeden, Ryan Nowers, Jay Dorris,
- Abstract要約: 本研究では,大規模言語モデルと検索増強世代(RAG)を利用した医薬ゲノム解析のための人工知能ツールであるSherpa Rxを評価した。
Sherpa Rxは、Pharmacogenomics Knowledgebase (ParmGKB)データとCPICガイドラインを統合し、文脈的に関連する応答を生成する。
26項目のCPICガイドラインにまたがるデータセット (N=260クエリ) を用いて, 薬物と遺伝子相互作用, 投与勧告, 治療効果を検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This study evaluated Sherpa Rx, an artificial intelligence tool leveraging large language models and retrieval-augmented generation (RAG) for pharmacogenomics, to validate its performance on key response metrics. Sherpa Rx integrated Clinical Pharmacogenetics Implementation Consortium (CPIC) guidelines with Pharmacogenomics Knowledgebase (PharmGKB) data to generate contextually relevant responses. A dataset (N=260 queries) spanning 26 CPIC guidelines was used to evaluate drug-gene interactions, dosing recommendations, and therapeutic implications. In Phase 1, only CPIC data was embedded. Phase 2 additionally incorporated PharmGKB content. Responses were scored on accuracy, relevance, clarity, completeness (5-point Likert scale), and recall. Wilcoxon signed-rank tests compared accuracy between Phase 1 and Phase 2, and between Phase 2 and ChatGPT-4omini. A 20-question quiz assessed the tool's real-world applicability against other models. In Phase 1 (N=260), Sherpa Rx demonstrated high performance of accuracy 4.9, relevance 5.0, clarity 5.0, completeness 4.8, and recall 0.99. The subset analysis (N=20) showed improvements in accuracy (4.6 vs. 4.4, Phase 2 vs. Phase 1 subset) and completeness (5.0 vs. 4.8). ChatGPT-4omini performed comparably in relevance (5.0) and clarity (4.9) but lagged in accuracy (3.9) and completeness (4.2). Differences in accuracy between Phase 1 and Phase 2 was not statistically significant. However, Phase 2 significantly outperformed ChatGPT-4omini. On the 20-question quiz, Sherpa Rx achieved 90% accuracy, outperforming other models. Integrating additional resources like CPIC and PharmGKB with RAG enhances AI accuracy and performance. This study highlights the transformative potential of generative AI like Sherpa Rx in pharmacogenomics, improving decision-making with accurate, personalized responses.
- Abstract(参考訳): 本研究では,大規模な言語モデルと検索強化世代(RAG)を利用した人工知能ツールであるSherpa Rxを薬理ゲノミクスで評価し,その性能を重要応答指標で検証した。
Sherpa Rxは、Pharmacogenomics Knowledgebase (PharmGKB)データとCPICガイドラインを統合し、文脈的に関連する応答を生成する。
26項目のCPICガイドラインにまたがるデータセット (N=260クエリ) を用いて, 薬物と遺伝子相互作用, 投与勧告, 治療効果を検討した。
フェーズ1ではCPICデータのみを埋め込んだ。
第2相はPharmGKBコンテンツも取り入れた。
応答は精度,関連性,明瞭度,完全度(5点類似度),リコールで測定された。
ウィルコクソンのサインランク試験は第1相と第2相の精度と第2相と第4相のChatGPT-4ominiの精度を比較した。
20件のクイズで、他のモデルに対する実際の適用性を評価した。
フェーズ1(N=260)では、Sherpa Rxは精度4.9、関連5.0、明確5.0、完全4.8、リコール0.99のハイパフォーマンスを示した。
サブセット分析(N=20)では精度(4.6 vs. 4.4, フェーズ2 vs. フェーズ1)と完全性(5.0 vs. 4.8)が向上した。
ChatGPT-4ominiは、関連性(5.0)と明確性(4.9)を両立させたが、精度(3.9)と完全性(4.2)は低かった。
第1相と第2相の精度の差は統計的に有意ではなかった。
しかし、第2相はChatGPT-4ominiを大きく上回った。
20クエストクイズでは、シェルパRxは90%の精度を達成し、他のモデルを上回った。
CPICやPharmGKBなどのリソースをRAGと統合することで、AIの精度とパフォーマンスが向上する。
この研究は、薬理ゲノミクスにおけるSherpa Rxのような生成AIの変換可能性を強調し、正確でパーソナライズされた応答による意思決定を改善する。
関連論文リスト
- CopulaSMOTE: A Copula-Based Oversampling Approach for Imbalanced Classification in Diabetes Prediction [0.0]
本研究では,マイノリティクラスにおけるデータ生成時の依存構造を保存するコプラに基づくデータ拡張について検討した。
XGBoostとA2コプラオーバーサンプリングを組み合わせることで、精度が4.6%、精度が15.6%、リコールが20.4%、F1スコアが18.2%、AUCが25.5%向上した。
この研究は、データ拡張にA2コプラを初めて使用したことで知られており、SMOTE技術に代わるものとして機能している。
論文 参考訳(メタデータ) (2025-06-18T22:21:40Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - Can Reasoning LLMs Enhance Clinical Document Classification? [7.026393789313748]
大規模言語モデル(LLM)は、このタスクの正確性と効率性において有望な改善を提供する。
本研究では,8つのLDMの性能と一貫性を評価する。4つの推論(Qwen QWQ, Deepseek Reasoner, GPT o3 Mini, Gemini 2.0 Flash Thinking)と4つの非推論(Llama 3.3, GPT 4o Mini, Gemini 2.0 Flash, Deepseek Chat)。
その結果、推論モデルは精度71%(68%)とF1スコア(67%(60%))で非推論モデルを上回った。
論文 参考訳(メタデータ) (2025-04-10T18:00:27Z) - Evaluating the Feasibility and Accuracy of Large Language Models for Medical History-Taking in Obstetrics and Gynecology [4.48731404829722]
効果的な医師と患者のコミュニケーションは重要であるが、多くの時間を消費するので、クリニックは非効率になる。
近年のLarge Language Models (LLMs) の進歩は、医療履歴の自動作成と診断精度の向上のための潜在的なソリューションを提供する。
ChatGPT-4oとChatGPT-4o-miniとの医師と患者との相互作用をシミュレートするAI駆動型会話システムを開発した。
両モデルとも不妊の履歴取り出しを自動化できる可能性を示し、ChatGPT-4o-miniは完全性と抽出精度に優れていた。
論文 参考訳(メタデータ) (2025-03-31T14:09:53Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Ensemble model for pre-discharge icd10 coding prediction [45.82374977939355]
正確なコード予測のための複数の臨床データソースを組み込んだアンサンブルモデルを提案する。
平均精度は0.73および0.58、F1スコアは0.56および0.35、患者および外来データセットの主診断予測では0.71および0.4のマルチラベル分類精度を得る。
論文 参考訳(メタデータ) (2020-12-16T07:02:56Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Joint Prediction and Time Estimation of COVID-19 Developing Severe
Symptoms using Chest CT Scan [49.209225484926634]
術後に重篤な症状を発症するかどうかを判定するための共同分類法と回帰法を提案する。
提案手法は,各試料の重量を考慮し,外乱の影響を低減し,不均衡な分類の問題を検討する。
提案手法では, 重症症例の予測精度76.97%, 相関係数0.524, 変換時間0.55日差が得られた。
論文 参考訳(メタデータ) (2020-05-07T12:16:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。