論文の概要: Medical Triage as Pairwise Ranking: A Benchmark for Urgency in Patient Portal Messages
- arxiv url: http://arxiv.org/abs/2601.13178v1
- Date: Mon, 19 Jan 2026 16:05:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.960717
- Title: Medical Triage as Pairwise Ranking: A Benchmark for Urgency in Patient Portal Messages
- Title(参考訳): Pairwise Rankingとしての医用トリアージ : 患者ポータルメッセージにおける緊急基準
- Authors: Joseph Gatto, Parker Seegmiller, Timothy Burdick, Philip Resnik, Roshnik Rahat, Sarah DeLozier, Sarah M. Preum,
- Abstract要約: 本稿では,外来門脈メッセージの文脈で医学的トリアージを研究するための,最初の大規模公開データセットを紹介する。
新規のタスク定式化では,患者メッセージのトリアージをペアワイズ推論問題とみなし,医師の受信箱のトーナメント形式のリソートで「どのメッセージがより医療的に緊急であるか」をLLMに教える。
PMR-Benchベンチマークには1569のユニークなメッセージと2000以上の高品質なテストペアが含まれています。
- 参考スコア(独自算出の注目度): 7.172145560602484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical triage is the task of allocating medical resources and prioritizing patients based on medical need. This paper introduces the first large-scale public dataset for studying medical triage in the context of asynchronous outpatient portal messages. Our novel task formulation views patient message triage as a pairwise inference problem, where we train LLMs to choose `"which message is more medically urgent" in a head-to-head tournament-style re-sort of a physician's inbox. Our novel benchmark PMR-Bench contains 1569 unique messages and 2,000+ high-quality test pairs for pairwise medical urgency assessment alongside a scalable training data generation pipeline. PMR-Bench includes samples that contain both unstructured patient-written messages alongside real electronic health record (EHR) data, emulating a real-world medical triage scenario. We develop a novel automated data annotation strategy to provide LLMs with in-domain guidance on this task. The resulting data is used to train two model classes, UrgentReward and UrgentSFT, leveraging Bradley-Terry and next token prediction objective, respectively to perform pairwise urgency classification. We find that UrgentSFT achieves top performance on PMR-Bench, with UrgentReward showing distinct advantages in low-resource settings. For example, UrgentSFT-8B and UrgentReward-8B provide a 15- and 16-point boost, respectively, on inbox sorting metrics over off-the-shelf 8B models. Paper resources can be found at https://tinyurl.com/Patient-Message-Triage
- Abstract(参考訳): 医療トリアージ(英: Medical triage)とは、医療資源を割り当て、医療ニーズに基づいて患者を優先順位付けする作業である。
本稿では,非同期な外来ポータルメッセージの文脈で医学的トリアージを研究するための,最初の大規模公開データセットを紹介する。
新たなタスク定式化では,患者メッセージのトリアージを,医師の受信箱のトーナメント形式のリソートで「どのメッセージがより医療的に緊急か」をLLMに教える,というペアワイズ推論問題として捉えている。
私たちの新しいベンチマークであるPMR-Benchには、1569のユニークなメッセージと2000以上の高品質なテストペアが含まれています。
PMR-Benchには、実際の電子健康記録(EHR)データとともに、構造化されていない患者によって書かれたメッセージの両方を含むサンプルが含まれており、実際の医療トリアージシナリオをエミュレートしている。
我々は,LLMにドメイン内ガイダンスを提供するための新しい自動データアノテーション戦略を開発した。
得られたデータは、2つのモデルクラスであるUrgentRewardとUrgentSFTのトレーニングに使用され、それぞれBradley-Terryと次のトークン予測目標を活用して、ペアで緊急分類を行う。
UrgentSFTはPMR-Bench上で最高の性能を達成でき、低リソース環境ではUrgentRewardが明確な利点を示しています。
例えば、UrgentSFT-8BとUrgentReward-8Bは、それぞれ15点と16点のブースターを提供する。
Paperリソースはhttps://tinyurl.com/Patient-Message-Triageにある。
関連論文リスト
- Dual-stage and Lightweight Patient Chart Summarization for Emergency Physicians [31.476936654094942]
組込みデバイス上で完全に動作する2段階の要約システムを提案する。
検索段階では、ローカルに保存されたEHRを使用し、長いメモを意味的に一貫性のあるセクションに分割し、クエリ毎に最も関連性の高いセクションを検索する。
生成段階は、検索したテキストから要約を生成するために、ローカルにホストされた小さな言語モデル(SLM)を使用する。
論文 参考訳(メタデータ) (2025-10-05T19:30:56Z) - Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [57.873833577058]
医療知識の豊富なマルチモーダルデータセットを構築した。
次に医学専門のMLLMであるLingshuを紹介します。
Lingshuは、医療専門知識の組み込みとタスク解決能力の向上のために、マルチステージトレーニングを行っている。
論文 参考訳(メタデータ) (2025-06-08T08:47:30Z) - TheBlueScrubs-v1, a comprehensive curated medical dataset derived from the internet [1.4043931310479378]
BlueScrubs-v1は、広範囲のインターネットコーパスから得られた2500億以上の医療トークンの収集されたデータセットである。
各テキストには、医療関連性、精度、事実の詳細、安全性と倫理基準を含む3つのLCMベースの品質スコアが割り当てられている。
このData Descriptorは、データセットの作成と検証について詳述し、医療AI研究の潜在的有用性について説明している。
論文 参考訳(メタデータ) (2025-04-01T22:25:19Z) - AutoMIR: Effective Zero-Shot Medical Information Retrieval without Relevance Labels [19.90354530235266]
textbfSelf-textbfLearning textbfHypothetical textbfDocument textbfEmbeddings (textbfSL-HyDE)を導入してこの問題に対処する。
SL-HyDEは、与えられたクエリに基づいて仮説文書を生成するために、大きな言語モデル(LLM)をジェネレータとして利用する。
実世界の医療シナリオを基盤とした総合的な評価フレームワークとして,中国医療情報検索ベンチマーク(CMIRB)を提案する。
論文 参考訳(メタデータ) (2024-10-26T02:53:20Z) - ViMQ: A Vietnamese Medical Question Dataset for Healthcare Dialogue
System Development [1.4315915057750197]
ベトナムでは,文レベルおよびエンティティレベルのアノテーションを持つ患者からの医療質問のデータセットを公開している。
本研究では,スパンノイズモデルを用いた簡易な自己教師型学習手法を提案する。
論文 参考訳(メタデータ) (2023-04-27T17:59:53Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Students Need More Attention: BERT-based AttentionModel for Small Data
with Application to AutomaticPatient Message Triage [65.7062363323781]
BioBERT (Bidirectional Representations from Transformers for Biomedical Text Mining) に基づく新しいフレームワークを提案する。
LESA-BERTと呼ぶBERTの各層にラベル埋め込みを導入し、(ii)LESA-BERTを小さな変種に蒸留することにより、小さなデータセットで作業する際のオーバーフィッティングとモデルサイズを低減することを目指す。
アプリケーションとして,本フレームワークを用いて,患者ポータルメッセージトリアージのモデルを構築し,メッセージの緊急度を非緊急度,中度度,緊急度という3つのカテゴリに分類する。
論文 参考訳(メタデータ) (2020-06-22T03:39:00Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。