論文の概要: Reliable Extraction of Clinical Follow-Up Instructions: A Hybrid Neural-Symbolic Pipeline
- arxiv url: http://arxiv.org/abs/2605.26560v1
- Date: Tue, 26 May 2026 05:14:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.680889
- Title: Reliable Extraction of Clinical Follow-Up Instructions: A Hybrid Neural-Symbolic Pipeline
- Title(参考訳): 臨床フォローアップ指導の信頼性--ハイブリッドニューラルネットワーク-シンボリックパイプライン-
- Authors: Michal Laufer, Yehudit Aperstein, Alexander Apartsin,
- Abstract要約: 我々は,ニューラルシンボリックなハイブリッドパイプラインを直接生成に対して試験する。
本研究は,2000点の合成外用コーパスについて検討した。
- 参考スコア(独自算出の注目度): 43.0484058393522
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective. Outpatient notes carry follow-up instructions pairing actions with future times ("MRI brain in two weeks"). Extracting (action, date) pairs supports scheduling and audit, but generative extractors miss the date because linking and arithmetic are implicit in decoding. We test a hybrid neural-symbolic pipeline against direct generation. Methods. We define TestSpecification and TimeSpecification entities and a ScheduledFor relation. BioBERT feeds BIO tagging and a biaffine linker; entities are canonicalized via a 28-action ontology and times normalized to day offsets deterministically. We evaluate on a 2,000-note synthetic outpatient corpus with action-disjoint splits (18 train, 6 OOV-test) against zero-shot GPT-4o-mini and LoRA-fine-tuned LLaMA-3 8B with note-level bootstrap 95% CIs. Results. On 259-note seen and OOV splits the hybrid pipeline achieves Test-Time Pair F1 of 0.997 and 0.986 with 0.00-day MAE. Baselines reach high action F1 (LLaMA-3 0.992; GPT-4o-mini 0.963 seen) but Pair F1 stays at 0.51-0.57 (LLaMA-3) and 0.53 (GPT-4o-mini), CIs non-overlapping with the hybrid. Conclusion. Separating learned entity extraction from deterministic date arithmetic outperforms generation on this benchmark, generalizes to held-out actions, and exposes failure modes. Transfer to real EHR notes is the next validation; a first-pass realism check is in Limitations.
- Abstract(参考訳): 目的。
外来のノートは、将来の時間とペアリングの指示を受ける("MRI brain in two weeks")。
抽出(アクション、日付)ペアはスケジューリングと監査をサポートするが、生成的抽出器はデコードにおいてリンクと算術が暗黙的であるため、日付を逃す。
我々は,ニューラルシンボリックなハイブリッドパイプラインを直接生成に対して試験する。
メソッド。
TestSpecification と TimeSpecification のエンティティと ScheduledFor の関係を定義します。
BioBERTは、BIOタグ付けとビファインリンカーを供給し、エンティティは28アクションオントロジーと日々のオフセットに正常化された時間によって、決定的に正準化される。
ゼロショット GPT-4o-mini と LoRA-fine-tuned LLaMA-3 8B に対して, アクション・ディスジョイント・スプリット(18例, 6例, OOV-test)を併用した2000点の合成外用コーパスについて検討した。
結果。
259注でOOVはハイブリッドパイプラインを分割し、0.997と0.986のテストタイムペアF1を0.00日MAEで達成した。
ベースラインは高い作用を持つF1(LLaMA-3 0.992; GPT-4o-mini 0.963)に達するが、Pair F1は0.51-0.57(LLaMA-3)と0.53(GPT-4o-mini)に留まり、CIはハイブリッドと重複しない。
結論。
決定論的日付算術からの学習されたエンティティ抽出は、このベンチマークで生成を上回り、保留動作に一般化し、障害モードを公開する。
実際の EHR ノートへの転送が次のバリデーションである。
関連論文リスト
- A Controlled Synthetic Benchmark for Educational Aspect-Based Sentiment Analysis [47.027290803102666]
本研究は,1万の総合的な授業レビューから構築されたABSAの教育的評価基準について紹介する。
最強の未調整モデルであるBERTは0.2760マイクロF1に達する。
Herathらによる2,829名の学生フィードバックレビューに対する保守的な外部評価では、9アスペクト重なりのBERTでは0.4593のマイクロF1が得られる。
論文 参考訳(メタデータ) (2026-05-25T07:05:21Z) - Joint Treatment Effect Estimation from Incomplete Healthcare Data: Temporal Causal Normalizing Flows with LLM-driven Evolutionary MNAR Imputation [0.0]
不完全長手EHRによる治療効果推定のための2段階パイプラインを提案する。
CaulFlow-Tは、長期記憶(LSTM)を符号化した患者履歴を持つ、DAGに制約された正規化フローである。
CaulFlow-Tは、正確な非可逆逆推論を行い、変分推論からの近似誤差を回避し、明示的な因果構造を通して共起を分離する。
論文 参考訳(メタデータ) (2026-05-06T16:53:08Z) - When Agents Look the Same: Quantifying Distillation-Induced Similarity in Tool-Use Behaviors [66.18091962164219]
既存のメトリクスは、タスクの成功に必要な義務的な振る舞いと、モデルの自律的な嗜好を反映した命令的でないパターンを区別することができない。
言語アライメントのための textbfResponse Pattern similarity (RPS) と、有向グラフとしてモデル化されたツール使用習慣のための textbfAction Graph similarity (AGS) である。
論文 参考訳(メタデータ) (2026-04-23T03:48:56Z) - Representation Before Training: A Fixed-Budget Benchmark for Generative Medical Event Models [0.3250525349446657]
我々は,表現決定が1世紀前の事前学習予算の共有後の下流予測にどのように影響するかを評価する。
我々はMIMIC-IVで28個の整形トランスを訓練し,30個の臨床結果について評価した。
論文 参考訳(メタデータ) (2026-04-18T01:38:47Z) - Benchmarking IoT Time-Series AD with Event-Level Augmentations [34.864214444544565]
実世界の問題をシミュレートする統合されたイベントレベル拡張による評価プロトコルを提案する。
5つの公開異常データセット上で14の代表的なモデルを評価する。
論文 参考訳(メタデータ) (2026-02-17T09:45:44Z) - When Domain Pretraining Interferes with Instruction Alignment: An Empirical Study of Adapter Merging in Medical LLMs [0.6345523830122167]
大規模言語モデルは、ドメイン適応と命令アライメントを組み合わせる際に驚くべきアダプタ干渉を示す。
医学LLMのための2段階のLORAパイプラインについて検討し、ドメイン指向事前トレーニング(PT)と教師付き微調整(SFT)を個別に訓練し、後にマージした。
論文 参考訳(メタデータ) (2026-01-26T10:54:06Z) - U-Mamba2-SSL for Semi-Supervised Tooth and Pulp Segmentation in CBCT [44.3806898357896]
U-Mamba2-SSLは,U-Mamba2モデル上に構築され,多段階の学習戦略を用いる,新しい半教師付き学習フレームワークである。
U-Mamba2-SSLは平均スコア0.789、DSC0.917を隠しテストセットで達成し、STSR 2025のタスク1で1位となった。
論文 参考訳(メタデータ) (2025-09-24T14:19:33Z) - Advanced Deep Learning Techniques for Automated Segmentation of Type B Aortic Dissections [4.545298205355719]
B型大動脈解離切除のための深層学習パイプラインを4本開発した。
Dice Coefficients for TL, 0.88 $pm$ 0.18, 0.47 $pm$ 0.25であった。
論文 参考訳(メタデータ) (2025-06-27T13:38:33Z) - MAWIFlow Benchmark: Realistic Flow-Based Evaluation for Network Intrusion Detection [47.86433139298671]
本稿では,MAWILAB v1.1データセットから得られたフローベースベンチマークであるMAWIFlowを紹介する。
得られたデータセットは、2011年1月、2016年、2021年に太平洋横断のバックボーンのトラフィックから引き出された、時間的に異なるサンプルで構成されている。
決定木、ランダムフォレスト、XGBoost、ロジスティック回帰を含む伝統的な機械学習手法は、CNN-BiLSTMアーキテクチャに基づいたディープラーニングモデルと比較される。
論文 参考訳(メタデータ) (2025-06-20T14:51:35Z) - Clustered Switchback Designs for Experimentation Under Spatio-temporal Interference [44.644520116360106]
我々は, 平均治療効果 (GATE) を推定し, 全単位を常に治療やコントロールに曝露した平均結果の差を推定した。
そこで我々は,単位をクラスタにグループ化し,時間ステップをブロックにグループ化する,クラスタ化されたスイッチバック設計を提案する。
良好なクラスタリングを許容するグラフに対して, トラッピングされたHorvitz-Thompson推定器が$tilde O(1/NT)$平均二乗誤差(MSE)を達成することを示す。
我々の結果は、citethu2022switchback、ugander2013graph、citetleung2022rateの結果を同時に一般化する。
論文 参考訳(メタデータ) (2023-12-25T01:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。