論文の概要: Automating Pharmacovigilance Evidence Generation: Using Large Language Models to Produce Context-Aware SQL
- arxiv url: http://arxiv.org/abs/2406.10690v3
- Date: Wed, 4 Sep 2024 16:58:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-07 02:31:44.652740
- Title: Automating Pharmacovigilance Evidence Generation: Using Large Language Models to Produce Context-Aware SQL
- Title(参考訳): 薬理ビジランスのエビデンス生成の自動化:大規模言語モデルを用いてコンテキスト対応SQLを生成する
- Authors: Jeffery L. Painter, Venkateswara Rao Chalamalasetti, Raymond Kassekert, Andrew Bate,
- Abstract要約: 検索拡張世代(RAG)フレームワークでOpenAIのGPT-4モデルを利用する。
ビジネスコンテキストドキュメントはビジネスコンテキストドキュメントでリッチ化され、NLQを構造化クエリ言語クエリに変換する。
複雑性の高いクエリが除外された場合、パフォーマンスは最大85%向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: To enhance the efficiency and accuracy of information retrieval from pharmacovigilance (PV) databases by employing Large Language Models (LLMs) to convert natural language queries (NLQs) into Structured Query Language (SQL) queries, leveraging a business context document. Materials and Methods: We utilized OpenAI's GPT-4 model within a retrieval-augmented generation (RAG) framework, enriched with a business context document, to transform NLQs into syntactically precise SQL queries. Each NLQ was presented to the LLM randomly and independently to prevent memorization. The study was conducted in three phases, varying query complexity, and assessing the LLM's performance both with and without the business context document. Results: Our approach significantly improved NLQ-to-SQL accuracy, increasing from 8.3\% with the database schema alone to 78.3\% with the business context document. This enhancement was consistent across low, medium, and high complexity queries, indicating the critical role of contextual knowledge in query generation. Discussion: The integration of a business context document markedly improved the LLM's ability to generate accurate and contextually relevant SQL queries. Performance achieved a maximum of 85\% when high complexity queries are excluded, suggesting promise for routine deployment. Conclusion: This study presents a novel approach to employing LLMs for safety data retrieval and analysis, demonstrating significant advancements in query generation accuracy. The methodology offers a framework applicable to various data-intensive domains, enhancing the accessibility and efficiency of information retrieval for non-technical users.
- Abstract(参考訳): 目的: 自然言語クエリ (NLQ) を構造化クエリ言語 (SQL) クエリに変換するために, 大規模言語モデル (LLM) を用いることにより, 医薬ナビランス (PV) データベースからの情報検索の効率性と精度を向上させる。
資料と方法:我々はOpenAIのGPT-4モデルを、ビジネスコンテキストドキュメントに富んだ検索拡張世代(RAG)フレームワークで活用し、NLQを構文的に正確なSQLクエリに変換する。
各NLQは,暗記を防ぐためにランダムかつ独立にLLMに提示された。
この研究は3つのフェーズで行われ、クエリの複雑さが変化し、LLMの性能はビジネスコンテキスト文書と無関係に評価された。
結果:NLQ-to-SQLの精度は,データベーススキーマだけで8.3\%から,ビジネスコンテキスト文書で78.3\%に向上した。
この拡張は、低、中、高複雑性のクエリ間で一貫性があり、クエリ生成におけるコンテキスト知識の重要な役割を示している。
議論: ビジネスコンテキストドキュメントの統合は、LLMの正確でコンテキストに関連のあるSQLクエリを生成する能力を大幅に改善しました。
複雑性の高いクエリが除外された場合、パフォーマンスは最大85%向上し、定期的なデプロイメントの約束が示唆された。
結論: 本研究は, LLMを安全データ検索と解析に利用するための新しいアプローチを示し, クエリ生成精度の大幅な向上を示す。
この方法論は、様々なデータ集約ドメインに適用可能なフレームワークを提供し、非技術ユーザに対する情報検索のアクセシビリティと効率を高める。
関連論文リスト
- A Survey on Employing Large Language Models for Text-to-SQL Tasks [7.728180183687891]
リレーショナルデータベースに格納されるデータの量の増加により、様々な分野において、このデータの効率的なクエリと利用の必要性が高まっている。
LLM(Large Language Models)の最近の発展を活かすため、様々な新しい手法が登場し、迅速なエンジニアリングと微調整に重点が置かれている。
論文 参考訳(メタデータ) (2024-07-21T14:48:23Z) - Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
テキストの匿名化は、プライバシーを維持しながら機密データを共有するために重要である。
既存の技術は、大規模言語モデルの再識別攻撃能力の新たな課題に直面している。
本稿では,3つのLCMベースコンポーネント – プライバシ評価器,ユーティリティ評価器,最適化コンポーネント – で構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - Large Language Models: A New Approach for Privacy Policy Analysis at Scale [1.7570777893613145]
本研究は,大規模プライバシポリシから効果的かつ効率的にプライバシプラクティスを抽出する代替手段として,LLM(Large Language Models)の適用を提案する。
我々はChatGPTやLlama 2といった有名なLLMを活用し、プロンプト、パラメータ、モデルの最適設計に関するガイダンスを提供する。
評価では、ドメイン内のいくつかの有名なデータセットをベンチマークとして、その例外的な性能を評価し、F1スコアが93%を超えた。
論文 参考訳(メタデータ) (2024-05-31T15:12:33Z) - ChatSOS: Vector Database Augmented Generative Question Answering Assistant in Safety Engineering [0.0]
本研究は,2013年から2023年の間に中国で発生した117件の爆発事故のベクターデータベースを構築した。
情報検索品質において関係データベースより優れているベクトルデータベースを利用することで,LLMによりリッチで関連性の高い知識を提供する。
論文 参考訳(メタデータ) (2024-05-08T07:21:26Z) - Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
大規模テキストコーパスで事前訓練されたLarge Language Models (LLMs) は、推奨システムを強化するための有望な道を示す。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - Persona-DB: Efficient Large Language Model Personalization for Response
Prediction with Collaborative Data Refinement [82.56964750522161]
本稿では,タスクコンテキスト間の一般化を改善するため,階層的な構築プロセスからなるシンプルなフレームワークであるPersona-DBを紹介する。
応答予測のタスクでは,Persona-DBは,検索サイズを大幅に削減した精度を維持する上で,優れた効率性を示す。
我々の実験は、ユーザーが極めて少ないデータを持つ場合、コールドスタートシナリオで15%以上の顕著な改善が示されていることも示している。
論文 参考訳(メタデータ) (2024-02-16T20:20:43Z) - Large Language Models Can Be Good Privacy Protection Learners [53.07930843882592]
本稿では,プライバシ保護言語モデル(PPLM)を紹介する。
本研究は, コーパスキュレーション, ペナルティに基づくトレーニング損失の相違, 命令に基づくチューニングなど, モデル設計の理論的解析を行う。
特に、肯定的な例と否定的な例の両方による命令チューニングは、モデルの知識を高めながら、個人データを効果的に保護する、有望な方法として際立っている。
論文 参考訳(メタデータ) (2023-10-03T22:37:01Z) - Utilizing Large Language Models for Natural Interface to Pharmacology
Databases [7.32741812808506]
本稿では,データベースに格納された構造化情報と対話するLarge Language Model (LLM)ベースの自然言語インタフェースを提案する。
このフレームワークは、幅広い医薬データや知識ベースを問うために一般化することができる。
論文 参考訳(メタデータ) (2023-07-26T17:50:11Z) - Unveiling the Potential of Knowledge-Prompted ChatGPT for Enhancing Drug
Trafficking Detection on Social Media [30.791563171321062]
そこで本研究では,人間がLLMと対話し,その検出作業を行うためのインタフェースとして,emphknowledgeインフォームドプロンプトを構成するための分析フレームワークを提案する。
実験により,本フレームワークは薬物輸送検出精度において,他のベースライン言語モデルよりも優れていることが示された。
この研究がソーシャルネットワークにもたらした意味は、オンラインのセキュリティと公衆安全を改善するための分析ツールに事前知識とシナリオベースのプロンプトを組み込むことの重要性を強調している。
論文 参考訳(メタデータ) (2023-07-07T16:15:59Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。