論文の概要: Efficient and Effective Internal Memory Retrieval for LLM-Based Healthcare Prediction
- arxiv url: http://arxiv.org/abs/2604.07659v1
- Date: Wed, 08 Apr 2026 23:56:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.602657
- Title: Efficient and Effective Internal Memory Retrieval for LLM-Based Healthcare Prediction
- Title(参考訳): LLMに基づくヘルスケア予測のための効率よく効果的な内部記憶検索
- Authors: Mingchen Li, Jiatan Huang, Zonghai Yao, Hong yu,
- Abstract要約: Keys to Knowledge (K2K)は、外部検索を内部のキーベースの知識アクセスに置き換える新しいフレームワークである。
我々は、K2Kが4つのベンチマーク医療結果予測データセットで最先端のパフォーマンスを達成することを示す。
- 参考スコア(独自算出の注目度): 18.76218483185158
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) hold significant promise for healthcare, yet their reliability in high-stakes clinical settings is often compromised by hallucinations and a lack of granular medical context. While Retrieval Augmented Generation (RAG) can mitigate these issues, standard supervised pipelines require computationally intensive searches over massive external knowledge bases, leading to high latency that is impractical for time-sensitive care. To address this, we introduce Keys to Knowledge (K2K), a novel framework that replaces external retrieval with internal, key-based knowledge access. By encoding essential clinical information directly into the model's parameter space, K2K enables rapid retrieval from internal key-value memory without inference-time overhead. We further enhance retrieval quality through activation-guided probe construction and cross-attention reranking. Experimental results demonstrate that K2K achieves state-of-the-art performance across four benchmark healthcare outcome prediction datasets.
- Abstract(参考訳): 大規模言語モデル (LLM) は医療において大きな可能性を秘めているが、高感度な臨床環境での信頼性は幻覚や詳細な医療状況の欠如によってしばしば損なわれる。
Retrieval Augmented Generation (RAG)はこれらの問題を緩和するが、標準的な教師付きパイプラインは巨大な外部知識ベースを計算的に集約的に探索する必要があるため、時間に敏感なケアでは現実的ではない高いレイテンシをもたらす。
これを解決するために、外部検索をキーベースの内部知識アクセスに置き換える新しいフレームワークであるKeys to Knowledge (K2K)を紹介する。
モデルパラメータ空間に直接本質的な臨床情報をエンコードすることで、K2Kは推論時間オーバーヘッドを伴わずに内部キー値メモリからの迅速な検索を可能にする。
さらに,アクティベーション誘導型プローブ構築とクロスアテンション更新により,検索品質を向上する。
実験結果から、K2Kは4つのベンチマーク医療結果予測データセットで最先端のパフォーマンスを達成することが示された。
関連論文リスト
- Early Risk Prediction with Temporally and Contextually Grounded Clinical Language Processing [14.905299009732602]
本研究では,時間的・文脈的リスク予測のための2つの補完的手法を提案する。
まず,階層型時空間グラフニューラルネットワークのHiTGNNを紹介する。
第二にReVeALは,大規模言語モデルの推論をより小さな検証モデルに変換する軽量なテスト時間フレームワークである。
論文 参考訳(メタデータ) (2025-11-27T02:47:30Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Automated Clinical Data Extraction with Knowledge Conditioned LLMs [7.935125803100394]
大規模言語モデル(LLM)は、レポート中の構造化されていないテキストの解釈に有効であるが、ドメイン固有の知識の欠如により幻覚することが多い。
In-context Learning (ICL) を通じて生成された内部知識を外部知識と整合させる新しい枠組みを提案する。
本フレームワークでは,検索した内部知識および外部知識の関連単位を抽出し,抽出した内部知識規則の真偽と有用性を評価する。
論文 参考訳(メタデータ) (2024-06-26T02:49:28Z) - Prompting Large Language Models for Zero-Shot Clinical Prediction with
Structured Longitudinal Electronic Health Record Data [7.815738943706123]
大規模言語モデル(LLM)は、伝統的に自然言語処理に向いている。
本研究では, GPT-4 などの LLM の EHR データへの適応性について検討する。
EHRデータの長手性、スパース性、知識を注入した性質に対応するため、本研究は特定の特徴を考慮に入れている。
論文 参考訳(メタデータ) (2024-01-25T20:14:50Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。