論文の概要: Conversational LLMs Simplify Secure Clinical Data Access, Understanding, and Analysis
- arxiv url: http://arxiv.org/abs/2507.01053v1
- Date: Fri, 27 Jun 2025 16:24:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.801929
- Title: Conversational LLMs Simplify Secure Clinical Data Access, Understanding, and Analysis
- Title(参考訳): 安全な臨床データアクセス、理解、分析を容易にする会話型LLM
- Authors: Rafi Al Attrach, Pedro Moreira, Rajna Fani, Renato Umeton, Leo Anthony Celi,
- Abstract要約: メディカル・インフォメーション・マート・フォー・インシデント・ケア(MIMIC-IV)は、世界最大のオープンソースEHRデータベースである。
M3は、研究者が普通の英語でデータベースと会話することを可能にする。
- 参考スコア(独自算出の注目度): 1.3984139865709486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As ever-larger clinical datasets become available, they have the potential to unlock unprecedented opportunities for medical research. Foremost among them is Medical Information Mart for Intensive Care (MIMIC-IV), the world's largest open-source EHR database. However, the inherent complexity of these datasets, particularly the need for sophisticated querying skills and the need to understand the underlying clinical settings, often presents a significant barrier to their effective use. M3 lowers the technical barrier to understanding and querying MIMIC-IV data. With a single command it retrieves MIMIC-IV from PhysioNet, launches a local SQLite instance (or hooks into the hosted BigQuery), and-via the Model Context Protocol (MCP)-lets researchers converse with the database in plain English. Ask a clinical question in natural language; M3 uses a language model to translate it into SQL, executes the query against the MIMIC-IV dataset, and returns structured results alongside the underlying query for verifiability and reproducibility. Demonstrations show that minutes of dialogue with M3 yield the kind of nuanced cohort analyses that once demanded hours of handcrafted SQL and relied on understanding the complexities of clinical workflows. By simplifying access, M3 invites the broader research community to mine clinical critical-care data and accelerates the translation of raw records into actionable insight.
- Abstract(参考訳): より大規模な臨床データセットが利用可能になるにつれて、彼らは医学研究の先例のない機会を解き放つ可能性がある。
中でも有名なのがMIMIC-IV(MIMIC-IV)で、これは世界最大のオープンソースEHRデータベースである。
しかし、これらのデータセットの本質的な複雑さ、特に高度なクエリスキルの必要性、基礎となる臨床設定を理解する必要性は、多くの場合、それらの効果的な使用に重大な障壁をもたらす。
M3はMIMIC-IVデータの理解とクエリの技術的障壁を低くする。
PhysioNetからMIMIC-IVを検索し、ローカルSQLiteインスタンス(あるいはホストされたBigQueryにフックする)を起動し、モデルコンテキストプロトコル(MCP)-letの研究者が普通の英語でデータベースと対話する。
M3は言語モデルを使用してSQLに翻訳し、MIMIC-IVデータセットに対してクエリを実行し、基盤となる妥当性と再現性のためのクエリと一緒に構造化された結果を返す。
デモでは、M3との対話の数分は、かつて手作りSQLに何時間も要求し、臨床ワークフローの複雑さを理解することに頼っていた、ニュアンスなコホート分析をもたらすことが示されている。
アクセスをシンプルにすることで、M3は幅広い研究コミュニティに臨床医療データをマイニングし、生記録の実用的な洞察への翻訳を加速させる。
関連論文リスト
- RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering [11.214912072391108]
現実世界のデータセットは、大きな属性と複雑な値の配列を特徴とすることが多い。
従来の手法ではデータセットのサイズと複雑さをLarge Language Modelsに完全にリレーすることはできません。
入力テーブル上でFTS(Full-Text Search)を利用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-22T13:13:06Z) - Retrieval augmented text-to-SQL generation for epidemiological question answering using electronic health records [0.6138671548064356]
本稿では,テキスト・ツー・ジェネレーションと検索拡張生成(RAG)を組み合わせて疫学的な疑問に答えるエンド・ツー・エンド手法を提案する。
RAGは、現実的な業界環境で示すように、彼らの能力を改善するための有望な方向性を提供します。
論文 参考訳(メタデータ) (2024-03-14T09:45:05Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Prompting Large Language Models for Zero-Shot Clinical Prediction with
Structured Longitudinal Electronic Health Record Data [7.815738943706123]
大規模言語モデル(LLM)は、伝統的に自然言語処理に向いている。
本研究では, GPT-4 などの LLM の EHR データへの適応性について検討する。
EHRデータの長手性、スパース性、知識を注入した性質に対応するため、本研究は特定の特徴を考慮に入れている。
論文 参考訳(メタデータ) (2024-01-25T20:14:50Z) - Leveraging LLMs for Synthesizing Training Data Across Many Languages in Multilingual Dense Retrieval [56.65147231836708]
SWIM-IRは, 微調整多言語高密度検索のための33言語を含む合成検索訓練データセットである。
SAPは、ターゲット言語における情報クエリの生成において、大きな言語モデル(LLM)を支援する。
我々のモデルはSWIM-Xと呼ばれ、人間に指示された高密度検索モデルと競合する。
論文 参考訳(メタデータ) (2023-11-10T00:17:10Z) - VBridge: Connecting the Dots Between Features, Explanations, and Data
for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。
我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。
症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文 参考訳(メタデータ) (2021-08-04T17:34:13Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。