論文の概要: Initial Investigation of LLM-Assisted Development of Rule-Based Clinical NLP System
- arxiv url: http://arxiv.org/abs/2506.16628v1
- Date: Thu, 19 Jun 2025 21:55:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.272869
- Title: Initial Investigation of LLM-Assisted Development of Rule-Based Clinical NLP System
- Title(参考訳): LLMを用いたルールベース臨床用NLPシステムの開発の初期検討
- Authors: Jianlin Shi, Brian T. Bucher,
- Abstract要約: ルールベースの自然言語処理 (NLP) システムは, 解釈可能性や操作効率の面から, 臨床現場で有効である。
我々は,ルールベースのシステム開発フェーズのみにおいて,大規模言語モデル(LLM)を用いた新しいアプローチを提案する。
本実験は,臨床関連テキストスニペットの同定において,例外的なリコールを示した。
- 参考スコア(独自算出の注目度): 0.10624623833188308
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite advances in machine learning (ML) and large language models (LLMs), rule-based natural language processing (NLP) systems remain active in clinical settings due to their interpretability and operational efficiency. However, their manual development and maintenance are labor-intensive, particularly in tasks with large linguistic variability. To overcome these limitations, we proposed a novel approach employing LLMs solely during the rule-based systems development phase. We conducted the initial experiments focusing on the first two steps of developing a rule-based NLP pipeline: find relevant snippets from the clinical note; extract informative keywords from the snippets for the rule-based named entity recognition (NER) component. Our experiments demonstrated exceptional recall in identifying clinically relevant text snippets (Deepseek: 0.98, Qwen: 0.99) and 1.0 in extracting key terms for NER. This study sheds light on a promising new direction for NLP development, enabling semi-automated or automated development of rule-based systems with significantly faster, more cost-effective, and transparent execution compared with deep learning model-based solutions.
- Abstract(参考訳): 機械学習 (ML) と大規模言語モデル (LLM) の進歩にもかかわらず、ルールベースの自然言語処理 (NLP) システムは、その解釈可能性と操作効率のため、臨床環境ではアクティブである。
しかしながら、彼らの手作業による開発とメンテナンスは、特に大きな言語的多様性を持つタスクにおいて、労働集約的である。
これらの制約を克服するため,ルールベースのシステム開発フェーズにのみ LLM を用いた新しい手法を提案する。
臨床ノートから関連スニペットを見つけ出し,ルールベースの名前付きエンティティ認識(NER)コンポーネントのスニペットから情報的キーワードを抽出する。
臨床関連テキストスニペット (Deepseek: 0.98, Qwen: 0.99) と, NER のキーワード抽出における 1.0 を検索した。
この研究は、ディープラーニングモデルベースソリューションと比較して、大幅に高速でコスト効率が高く透明な実行が可能な、ルールベースシステムの半自動または自動開発を可能にする、NLP開発のための有望な新しい方向性に光を当てている。
関連論文リスト
- Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Automating Intervention Discovery from Scientific Literature: A Progressive Ontology Prompting and Dual-LLM Framework [56.858564736806414]
本稿では,大規模言語モデル(LLM)を利用した科学文献の介入の同定手法を提案する。
言語病理領域における64,177論文のコーパスから,2,421件の介入が得られた。
論文 参考訳(メタデータ) (2024-08-20T16:42:23Z) - Large Language Model Distilling Medication Recommendation Model [58.94186280631342]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - Natural Language Programming in Medicine: Administering Evidence Based Clinical Workflows with Autonomous Agents Powered by Generative Large Language Models [29.05425041393475]
ジェネレーティブ・大型言語モデル(LLM)は医療において大きな可能性を秘めている。
本研究は, シミュレーション3次医療センターにおいて, 自律型エージェントとして機能するLSMの可能性を評価した。
論文 参考訳(メタデータ) (2024-01-05T15:09:57Z) - Supervised Knowledge Makes Large Language Models Better In-context Learners [94.89301696512776]
大規模言語モデル(LLM)は、素早い工学を通して、文脈内学習能力の出現を示す。
自然言語理解と質問応答におけるLLMの一般化性と事実性の向上という課題は、まだ未解決のままである。
本研究では, LLM の信頼性を高める枠組みを提案する。1) 分布外データの一般化,2) 差別モデルによる LLM のメリットの解明,3) 生成タスクにおける幻覚の最小化。
論文 参考訳(メタデータ) (2023-12-26T07:24:46Z) - Generative Large Language Models Are All-purpose Text Analytics Engines:
Text-to-text Learning Is All Your Need [24.672621081551675]
テキスト・トゥ・テキスト・ラーニング(text-to-text learning)として7つの重要なNLPタスクを定式化し,1つの総合的臨床LCMを用いて解決した。
提案手法は,7つの主要なNLPタスクのうち5つに対して,1つの統合生成LDMを用いて最先端の性能を達成した。
論文 参考訳(メタデータ) (2023-12-11T04:00:26Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Few-Shot Learning for Clinical Natural Language Processing Using Siamese
Neural Networks [3.9586758145580014]
臨床自然言語処理(NLP)は医療の新たな技術になりつつある。
深層学習は多くの臨床NLPタスクで最先端のパフォーマンスを達成した。
ディープラーニングモデルのトレーニングは通常、大きな注釈付きデータセットを必要とするが、通常は公開されていない。
論文 参考訳(メタデータ) (2022-08-31T15:36:27Z) - Towards Structuring Real-World Data at Scale: Deep Learning for
Extracting Key Oncology Information from Clinical Text with Patient-Level
Supervision [10.929271646369887]
実世界データ(RWD)の詳細な患者情報の大部分は、フリーテキストの臨床文書でのみ利用可能である。
従来のルールベースのシステムは、臨床テキストの言語的変異やあいまいさに弱い。
本稿では,患者レベルの管理を医療登録から活用することを提案する。
論文 参考訳(メタデータ) (2022-03-20T03:42:03Z) - HealthPrompt: A Zero-shot Learning Paradigm for Clinical Natural
Language Processing [3.762895631262445]
われわれはHealthPromptという新しいプロンプトベースのNLPフレームワークを開発した。
本研究は,6種類のPLMを用いたHealthPromptの詳細な分析を行った。
本実験は,臨床テキストのコンテキストを効果的に把握し,トレーニングデータなしで極めて良好に動作できることを証明した。
論文 参考訳(メタデータ) (2022-03-09T21:44:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。