論文の概要: EMR-AGENT: Automating Cohort and Feature Extraction from EMR Databases
- arxiv url: http://arxiv.org/abs/2510.00549v2
- Date: Thu, 02 Oct 2025 03:21:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.407128
- Title: EMR-AGENT: Automating Cohort and Feature Extraction from EMR Databases
- Title(参考訳): EMR-AGENT:EMRデータベースからのコホートと特徴抽出の自動化
- Authors: Kwanhyung Lee, Sungsoo Hong, Joonhyung Park, Jeonghyeop Lim, Juhwan Choi, Donghwee Yoon, Eunho Yang,
- Abstract要約: EMR-AGENTはエージェントベースのフレームワークで、手動のルール記述を動的に言語モデル駆動インタラクションに置き換える。
本フレームワークは,データベースの対話型クエリによるコホート選択,特徴抽出,コードマッピングを自動化する。
結果は3つのEMRデータベースにまたがる高い性能と一般化を示す。
- 参考スコア(独自算出の注目度): 41.15581072407935
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Machine learning models for clinical prediction rely on structured data extracted from Electronic Medical Records (EMRs), yet this process remains dominated by hardcoded, database-specific pipelines for cohort definition, feature selection, and code mapping. These manual efforts limit scalability, reproducibility, and cross-institutional generalization. To address this, we introduce EMR-AGENT (Automated Generalized Extraction and Navigation Tool), an agent-based framework that replaces manual rule writing with dynamic, language model-driven interaction to extract and standardize structured clinical data. Our framework automates cohort selection, feature extraction, and code mapping through interactive querying of databases. Our modular agents iteratively observe query results and reason over schema and documentation, using SQL not just for data retrieval but also as a tool for database observation and decision making. This eliminates the need for hand-crafted, schema-specific logic. To enable rigorous evaluation, we develop a benchmarking codebase for three EMR databases (MIMIC-III, eICU, SICdb), including both seen and unseen schema settings. Our results demonstrate strong performance and generalization across these databases, highlighting the feasibility of automating a process previously thought to require expert-driven design. The code will be released publicly at https://github.com/AITRICS/EMR-AGENT/tree/main. For a demonstration, please visit our anonymous demo page: https://anonymoususer-max600.github.io/EMR_AGENT/
- Abstract(参考訳): 臨床予測のための機械学習モデルは、Electronic Medical Records (EMRs)から抽出された構造化データに依存しているが、このプロセスはコホート定義、特徴選択、コードマッピングのためのハードコードされたデータベース固有のパイプラインに支配されている。
これらの手作業はスケーラビリティ、再現性、クロスインスティカルな一般化を制限する。
そこで本稿では,手動ルール記述を動的言語モデル駆動インタラクションに置き換え,構造化された臨床データの抽出と標準化を行うエージェントベースのフレームワークであるEMR-AGENT(Automated Generalized extract and Navigation Tool)を紹介する。
本フレームワークは,データベースの対話型クエリによるコホート選択,特徴抽出,コードマッピングを自動化する。
モジュールエージェントは、データ検索だけでなく、データベースの観察と意思決定のためのツールとしてもSQLを使用し、クエリ結果とスキーマとドキュメント上の理由を反復的に観察します。
これにより、手作りのスキーマ固有のロジックが不要になる。
厳密な評価を実現するため、3つのEMRデータベース(MIMIC-III, eICU, SICdb)のベンチマークコードベースを開発し、その中に見知らぬスキーマ設定を含める。
この結果から,これまで専門家主導設計が必要と考えられていたプロセスの自動化の実現可能性を強調した。
コードはhttps://github.com/AITRICS/EMR-AGENT/tree/mainで公開される。
デモのために、匿名のデモページをご覧ください。
関連論文リスト
- QueryGym: Step-by-Step Interaction with Relational Databases [30.757678338337055]
本稿では,LLMベースのクエリ計画エージェントの構築,テスト,評価を行う対話型環境であるQueryGymを紹介する。
既存のフレームワークは、エージェントを特定のクエリ言語方言に結びつけることや、それらの推論を曖昧にすることが多い。
QueryGymは、関係代数演算の明示的なシーケンスを構築するためにエージェントを必要とする。
論文 参考訳(メタデータ) (2025-09-25T22:48:49Z) - Agentic AI framework for End-to-End Medical Data Inference [5.871161259593687]
我々は、摂取から推論まで、臨床データパイプライン全体を自動化するエージェントAIフレームワークを導入する。
本システムは, 高齢者, 緩和ケア, 大腸内視鏡検査から入手可能なデータセットを用いて評価した。
論文 参考訳(メタデータ) (2025-07-24T05:56:25Z) - THOR: Transformer Heuristics for On-Demand Retrieval [10.667949307405983]
本稿では,eSapiens が設計・実装した THOR (Transformer Heuristics for On-Demand Retrieval) モジュールを紹介する。
THORモジュールは、非言語ユーザーがゼロ言語でシンプルでエンタープライズレベルの安全でライブデータにアクセスできるようにする。
論文 参考訳(メタデータ) (2025-07-13T11:48:24Z) - Leveraging Foundation Language Models (FLMs) for Automated Cohort Extraction from Large EHR Databases [50.552056536968166]
本稿では,2つの大規模かつ広くアクセス可能なEHRデータベース上で列マッチングを自動化するアルゴリズムを提案し,評価する。
提案手法は,学習済みの小型汎用言語モデルを用いて,13ドル列のうち12ドルを正確にマッチングし,高いトップ3の精度を92%の精度で達成する。
論文 参考訳(メタデータ) (2024-12-16T06:19:35Z) - UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。
本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文 参考訳(メタデータ) (2024-06-23T06:58:55Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。