論文の概要: Configurable Clinical Information Extraction with Agentic RAG: What Works, What Breaks, and Why
- arxiv url: http://arxiv.org/abs/2606.19602v1
- Date: Wed, 17 Jun 2026 21:12:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.544998
- Title: Configurable Clinical Information Extraction with Agentic RAG: What Works, What Breaks, and Why
- Title(参考訳): エージェントRAGによる構成可能な臨床情報抽出--何が機能するか,何が機能するか,なぜか
- Authors: Osman Alperen Çinar-Koraş, Marie Bauer, Sameh Khattab, Merlin Engelke, Moon Kim, Stephan Settelmeier, Shigeyasu Sugawara, Fabian Freisleben, Felix Nensa, Jens Kleesiek,
- Abstract要約: 患者コンテキストは、何百もの異種文書と何千もの構造化されたデータポイントにまたがる。
標準的な検索拡張生成は、このデータ、時間的推論、文書間の依存関係、メタデータの欠如に失敗する。
本稿では,ACIE (Agentic Clinical Information extract) を医科大学 Essen に導入する。
メタデータのギャップを定量化し、それが形成したアーキテクチャ上の決定をトレースし、独立した振り返りリンパ腫登録研究と共に抽出を評価する。
- 参考スコア(独自算出の注目度): 4.527967729863067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Patient contexts span hundreds of heterogeneous documents and thousands of structured data points, yet the document-level metadata that AI systems need for retrieval and triage is absent or incomplete. Standard retrieval-augmented generation fails on this data, mishandling temporal reasoning, cross-document dependencies, and missing metadata. We deploy ACIE (Agentic Clinical Information Extraction) at University Medicine Essen: an on-premise agentic RAG pipeline that reasons over complete patient contexts and grounds every answer in source passages for clinician verification. We quantify the metadata gap, trace the architectural decisions it shaped, and evaluate extraction alongside an independent retrospective lymphoma registry study, in which nuclear-medicine physicians verify every extracted value against its cited sources. Across 7,326 judgments, clinicians accepted 96.5\% of extractions, with per-type acceptance ranging from 80\% to 99\%.
- Abstract(参考訳): 患者コンテキストは、何百もの異質なドキュメントと何千もの構造化されたデータポイントにまたがるが、AIシステムが検索とトリアージに必要とするドキュメントレベルのメタデータは欠如している。
標準の検索拡張生成はこのデータで失敗し、時間的推論、ドキュメント間の依存関係、メタデータの欠如を誤処理する。
当科におけるACIE(Agentic Clinical Information extract: Agentic Clinical Information extract:ACIE)は,患者コンテキストの完全化を理由として,臨床検査のためのソースパスのすべての回答を根拠とした,オンプレミスのエージェントRAGパイプラインである。
我々はメタデータのギャップを定量化し、その形成したアーキテクチャ上の決定をトレースし、核医学医が抽出された全ての値を引用された情報源に対して検証する独立した振り返りリンパ腫登録研究と共に抽出を評価する。
7,326件の判定で、臨床医は96.5 %の抽出を受理し、タイプごとの受理は80 %から99 %であった。
関連論文リスト
- Detecting Clinical Discrepancies in Health Coaching Agents: A Dual-Stream Memory and Reconciliation Architecture [71.46525715889656]
汎用エージェントメモリシステムは、ユーザの最新のステートメントで古い事実を上書きすることでコヒーレンスを最適化する。
本稿では,患者の物語を構造化された臨床記録から厳密に分離するDual-Stream Memory Architectureを提案する。
675日間のウェルネスコーチングセッションにおいて,26名の患者を対象にこのアーキテクチャを評価した。
論文 参考訳(メタデータ) (2026-04-29T17:59:28Z) - A Semi-Automated Annotation Workflow for Paediatric Histopathology Reports Using Small Language Models [0.0]
本研究では,小言語モデル(SLM)を用いた資源効率のよい半自動アノテーションワークフローを開発し,構造化EPRデータから構造化情報を抽出する。
概念実証として、本ワークフローを小児腎生検報告、その制約された診断範囲と明確に定義された基礎生物学に応用した領域に適用する。
SLMを用いた自動情報抽出手法を開発しながら,本ワークフローを3つの会議の臨床的監視とともに反復的に開発し,グレート・オーモンド・ストリート病院の2,111件のデータセットから400件の報告をゴールドスタンダードとして手動で注釈付けする。
論文 参考訳(メタデータ) (2026-04-05T16:15:39Z) - HARMON-E: Hierarchical Agentic Reasoning for Multimodal Oncology Notes to Extract Structured Data [4.776184995012808]
本稿では,複雑なオンコロジーデータ抽出をモジュール型適応タスクに分解するエージェントフレームワークを提案する。
がん患者2250名を対象に,400,000件以上の非構造的臨床記録とPDFをスキャンし,F1スコアの平均0.93を達成した。
論文 参考訳(メタデータ) (2025-12-22T20:38:30Z) - OIDA-QA: A Multimodal Benchmark for Analyzing the Opioid Industry Documents Archive [50.468138755368805]
オピオイド危機は公衆衛生にとって重要な瞬間である。
UCSF-JHU Opioid Industry Documents Archive(OIDA)に公開されているデータと文書
本稿では,文書属性に応じて元のデータセットを整理することで,この問題に対処する。
論文 参考訳(メタデータ) (2025-11-13T03:27:32Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Towards Unifying Anatomy Segmentation: Automated Generation of a
Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines [113.08940153125616]
我々は533巻のボクセルレベルのラベルを142ドル(約1万2000円)で、全身CTスキャンのデータセットを作成し、解剖学的包括的カバレッジを提供する。
提案手法はラベル集約段階において手作業によるアノテーションに依存しない。
我々はCTデータに142ドルの解剖学的構造を予測できる統一解剖学的セグメンテーションモデルをリリースする。
論文 参考訳(メタデータ) (2023-07-25T09:48:13Z) - Detecting automatically the layout of clinical documents to enhance the
performances of downstream natural language processing [53.797797404164946]
我々は,臨床用PDF文書を処理し,臨床用テキストのみを抽出するアルゴリズムを設計した。
このアルゴリズムは、PDFを使った最初のテキスト抽出と、続いてボディテキスト、左書き、フッタなどのカテゴリに分類される。
それぞれのセクションのテキストから興味ある医学的概念を抽出し,医療的パフォーマンスを評価した。
論文 参考訳(メタデータ) (2023-05-23T08:38:33Z) - Event-based clinical findings extraction from radiology reports with
pre-trained language model [0.22940141855172028]
今回,臨床所見を付加した新しい放射線診断報告のコーパスを報告する。
金の標準コーパスには合計500点の注記CTレポートが含まれていた。
BERTを含む2つの最先端ディープラーニングアーキテクチャを用いて、トリガと引数のエンティティを抽出した。
論文 参考訳(メタデータ) (2021-12-27T05:03:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。