論文の概要: A Proactive EMR Assistant for Doctor-Patient Dialogue: Streaming ASR, Belief Stabilization, and Preliminary Controlled Evaluation
- arxiv url: http://arxiv.org/abs/2604.13059v1
- Date: Wed, 18 Mar 2026 05:54:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.646461
- Title: A Proactive EMR Assistant for Doctor-Patient Dialogue: Streaming ASR, Belief Stabilization, and Preliminary Controlled Evaluation
- Title(参考訳): 医師親和性対話のためのプロアクティブEMRアシスタント:ストリーミングASR, 信念安定化, 予備制御評価
- Authors: Zhenhai Pan, Yan Liu, Jia You,
- Abstract要約: 本稿では, ストリーム音声認識, 句読取復元, ステートフル抽出, 信念安定化, 客観的検索, 行動計画, リプレイ可能なレポート生成を中心に, エンドツーエンドの能動型EMRアシスタントを提案する。
全システムは0.84のステートイベントF1、0.87のリコール@5、83.3%のカバー、81.4%の構造化、完全性、80.0%のリスクリコールに到達している。
- 参考スコア(独自算出の注目度): 4.321699303483216
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most dialogue-based electronic medical record (EMR) systems still behave as passive pipelines: transcribe speech, extract information, and generate the final note after the consultation. That design improves documentation efficiency, but it is insufficient for proactive consultation support because it does not explicitly address streaming speech noise, missing punctuation, unstable diagnostic belief, objectification quality, or measurable next-action gains. We present an end-to-end proactive EMR assistant built around streaming speech recognition, punctuation restoration, stateful extraction, belief stabilization, objectified retrieval, action planning, and replayable report generation. The system is evaluated in a preliminary controlled setting using ten streamed doctor-patient dialogues and a 300-query retrieval benchmark aggregated across dialogues. The full system reaches state-event F1 of 0.84, retrieval Recall@5 of 0.87, and end-to-end pilot scores of 83.3% coverage, 81.4% structural completeness, and 80.0% risk recall. Ablations further suggest that punctuation restoration and belief stabilization may improve downstream extraction, retrieval, and action selection within this pilot. These results were obtained under a controlled simulated pilot setting rather than broad deployment claims, and they should not be read as evidence of clinical deployment readiness, clinical safety, or real-world clinical utility. Instead, they suggest that the proposed online architecture may be technically coherent and directionally supportive under tightly controlled pilot conditions. The present study should be read as a pilot concept demonstration under tightly controlled pilot conditions rather than as evidence of clinical deployment readiness or clinical generalizability.
- Abstract(参考訳): ほとんどの対話ベースの電子カルテ(EMR)システムは、音声の書き起こし、情報抽出、相談後の最後のメモの生成など、受動的パイプラインとして動作する。
この設計はドキュメンテーションの効率を向上させるが、ストリーミング音声のノイズ、句読点の欠如、不安定な診断信条、客観化品質、測定可能な次の行動利得に明示的に対応しないため、積極的な相談支援には不十分である。
本稿では, ストリーム音声認識, 句読取復元, ステートフル抽出, 信念安定化, 客観的検索, 行動計画, リプレイ可能なレポート生成を中心に, エンドツーエンドの能動型EMRアシスタントを提案する。
本システムは, 医師と患者との対話をストリーム化した10回と, ダイアログを集約した300クエリ検索ベンチマークを用いて, 予備制御環境で評価した。
完全システムは、0.84のステートイベントF1、0.87のリコール@5、83.3%のカバー、81.4%の構造的完全性、80.0%のリスクリコールに到達している。
さらにアブレーションは、句読的回復と信念の安定化が、このパイロット内の下流からの抽出、検索、行動選択を改善することを示唆している。
これらの結果は, 広範囲な展開条件ではなく, 制御されたパイロット環境下で得られたものであり, 臨床展開準備性, 臨床安全性, 実世界の臨床ユーティリティの証拠として読み取るべきではない。
代わりに彼らは、提案されたオンラインアーキテクチャは、厳密に制御されたパイロット条件下で技術的に一貫性があり、方向的に支援されるかもしれないことを示唆している。
本研究は, 臨床展開準備性や臨床応用可能性の証拠としてではなく, 厳密に制御されたパイロット条件下でのパイロット概念実証として解釈すべきである。
関連論文リスト
- Benchmarking Multi-turn Medical Diagnosis: Hold, Lure, and Self-Correction [72.89352076103889]
大規模言語モデル (LLM) は, 臨床情報がすべて一ターンで提供される場合に, 高い精度で診断を行う。
1,035例からなる高忠実多ターン診断ベンチマークであるMINTを導入する。
診断決定に大きな影響を及ぼす3つの永続的な行動パターンを明らかにする。
論文 参考訳(メタデータ) (2026-04-06T00:23:10Z) - EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews [7.325762712182949]
EviSearchは臨床エビデンステーブルのためのマルチエージェント抽出システムである。
パイプラインはマルチモーダルエビデンスソース間の高精度抽出のために設計されている。
EviSearchは、生きた体系的なレビューを加速し、手作業によるキュレーションの負担を軽減し、LCMベースの抽出をエビデンス合成パイプラインに統合するための安全で監査可能なパスを提供することを目的としている。
論文 参考訳(メタデータ) (2026-03-23T22:36:54Z) - Cerebra: A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.62016795093786]
CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文 参考訳(メタデータ) (2026-03-23T05:46:45Z) - Proactive Knowledge Inquiry in Doctor-Patient Dialogue: Stateful Extraction, Belief Updating, and Path-Aware Action Planning [4.321699303483216]
本研究では, 医師と患者との対話を, 部分観察可能性下での積極的な知識問合せ問題として定式化する。
提案するフレームワークは、ステートフル抽出、シーケンシャルな信念更新、ギャップ対応状態モデリング、客観的な医療知識によるハイブリッド検索、およびPOMDP-liteアクションプランナーを組み合わせたものである。
論文 参考訳(メタデータ) (2026-03-18T07:03:50Z) - Building Safe and Deployable Clinical Natural Language Processing under Temporal Leakage Constraints [39.44014654945035]
本研究は, 時間的リーク制約の下で安全かつデプロイ可能なNLPを構築するために必要なシステムレベルの設計選択に焦点を当てた。
モデル開発プロセスに解釈可能性を統合する軽量な監査パイプラインを提案し,最終訓練前の漏洩信号の同定と抑制を行う。
その結果, 監査されたモデルの方が, より保守的でキャリブレーションのよい推定値を示し, 放電関連語彙的手がかりへの依存度を低下させることがわかった。
論文 参考訳(メタデータ) (2026-01-24T01:46:46Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - A DeepSeek-Powered AI System for Automated Chest Radiograph Interpretation in Clinical Practice [83.11942224668127]
Janus-Pro-CXR (1B) はDeepSeek Janus-Proモデルに基づく胸部X線解釈システムである。
本システムは, 自動レポート生成において, 最先端のX線レポート生成モデルより優れる。
論文 参考訳(メタデータ) (2025-12-23T13:26:13Z) - CLIN-LLM: A Safety-Constrained Hybrid Framework for Clinical Diagnosis and Treatment Generation [0.31984926651189866]
LLM(Large Language Model)ベースのシステムは、しばしば医学的な根拠がなく、不確実性を定量化できない。
CLIN-LLMは,マルチモーダル患者エンコーディング,不確実性校正疾患分類,検索・拡張治療生成を統合した安全拘束型ハイブリッドパイプラインである。
論文 参考訳(メタデータ) (2025-10-26T10:11:53Z) - DispatchMAS: Fusing taxonomy and artificial intelligence agents for emergency medical services [49.70819009392778]
大規模言語モデル (LLM) とマルチエージェントシステム (MAS) は、ディスパッチを増強する機会を提供する。
本研究の目的は,現実的なシナリオをシミュレートする分類基盤型マルチエージェントシステムの開発と評価である。
論文 参考訳(メタデータ) (2025-10-24T08:01:21Z) - An Unsupervised Natural Language Processing Pipeline for Assessing Referral Appropriateness [0.0]
本稿では,参照理由の抽出と評価が可能な,完全に教師なしの自然言語処理パイプラインを提案する。
我々のパイプラインは、イタリアの医療用テキストで事前訓練されたTransformerベースの埋め込みを活用して、参照の理由をクラスタ化する。
教師なしの環境で動作し、さまざまな試験タイプにまたがって一般化されるように設計されている。
論文 参考訳(メタデータ) (2025-01-24T18:24:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。