論文の概要: Towards Explainable Doctor Recommendation with Large Language Models
- arxiv url: http://arxiv.org/abs/2503.02298v1
- Date: Tue, 04 Mar 2025 05:48:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:12:59.051903
- Title: Towards Explainable Doctor Recommendation with Large Language Models
- Title(参考訳): 大規模言語モデルを用いた説明可能な博士勧告に向けて
- Authors: Ziyang Zeng, Dongyuan Li, Yuqing Yang,
- Abstract要約: 我々は、医師推薦をランキングタスクとして定式化し、大規模言語モデル(LLM)に基づくポイントワイドランキングフレームワークを開発する。
本フレームワークは, 疾患治療ペアの関連性に応じて, ゼロショット設定で医師をランク付けする。
本研究は,38組以上の疾患治療ペアからなる専門知識駆動型医師ランキングデータセットであるDrRankを構築した。
- 参考スコア(独自算出の注目度): 4.745150727399434
- License:
- Abstract: The advent of internet medicine provides patients with unprecedented convenience in searching and communicating with doctors relevant to their diseases and desired treatments online. However, the current doctor recommendation systems fail to fully ensure the professionalism and interpretability of the recommended results. In this work, we formulate doctor recommendation as a ranking task and develop a large language model (LLM)-based pointwise ranking framework. Our framework ranks doctors according to their relevance regarding specific diseases-treatment pairs in a zero-shot setting. The advantage of our framework lies in its ability to generate precise and explainable doctor ranking results. Additionally, we construct DrRank, a new expertise-driven doctor ranking dataset comprising over 38 disease-treatment pairs. Experiment results on the DrRank dataset demonstrate that our framework significantly outperforms the strongest cross-encoder baseline, achieving a notable gain of +5.45 in the NDCG@10 score while maintaining affordable latency consumption. Furthermore, we comprehensively present the fairness analysis results of our framework from three perspectives of different diseases, patient gender, and geographical regions. Meanwhile, the interpretability of our framework is rigorously verified by three human experts, providing further evidence of the reliability of our proposed framework for doctor recommendation.
- Abstract(参考訳): インターネット医療の出現は、患者が自分の病気や希望する治療に関する医師を検索し、コミュニケーションする上で、前例のない便利さを提供する。
しかし、現在の医師推薦システムは、推奨された結果のプロフェッショナル主義と解釈可能性を完全に保証することができない。
本研究では,医師の推薦をランキングタスクとして定式化し,大規模言語モデル(LLM)に基づくポイントワイドランキングフレームワークを開発する。
本フレームワークは, 疾患治療ペアの関連性に応じて, ゼロショット設定で医師をランク付けする。
このフレームワークの利点は、正確で説明可能な医師のランキング結果を生成する能力にある。
さらに,38組以上の疾患治療ペアからなる専門知識駆動型医師ランキングデータセットDrRankを構築した。
DrRankデータセットの実験結果によると、我々のフレームワークは最強のクロスエンコーダベースラインを著しく上回り、安価なレイテンシ消費を維持しつつ、NDCG@10スコアで+5.45の顕著な上昇を達成した。
さらに, 病, 患者性, 地理的領域の3つの観点から, 枠組みの公平性分析結果を総合的に提示した。
一方、我々の枠組みの解釈可能性については、3人の人間専門家が厳格に検証し、提案した枠組みの信頼性のさらなる証拠を提供する。
関連論文リスト
- Hierarchical Divide-and-Conquer for Fine-Grained Alignment in LLM-Based Medical Evaluation [31.061600616994145]
HDCEvalは、専門医とのコラボレーションによって開発された、きめ細かい医療評価ガイドラインに基づいて構築されている。
このフレームワークは複雑な評価タスクを専門的なサブタスクに分解し、それぞれがエキスパートモデルによって評価される。
この階層的なアプローチは、評価の各側面が専門家の精度で扱われることを保証する。
論文 参考訳(メタデータ) (2025-01-12T07:30:49Z) - RuleAlign: Making Large Language Models Better Physicians with Diagnostic Rule Alignment [54.91736546490813]
本稿では,大規模言語モデルと特定の診断規則との整合性を考慮したルールアラインフレームワークを提案する。
患者と医師間の規則に基づくコミュニケーションを含む医療対話データセットを開発した。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-22T17:44:40Z) - Towards Evaluating and Building Versatile Large Language Models for Medicine [57.49547766838095]
MedS-Benchは大規模言語モデル(LLM)の性能を臨床的に評価するためのベンチマークである。
MedS-Benchは、臨床報告の要約、治療勧告、診断、名前付きエンティティ認識、医療概念説明を含む、11のハイレベルな臨床タスクにまたがる。
MedS-Insは58の医療指向言語コーパスで構成され、112のタスクで1350万のサンプルを収集している。
論文 参考訳(メタデータ) (2024-08-22T17:01:34Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - DocLens: Multi-aspect Fine-grained Evaluation for Medical Text Generation [37.58514130165496]
本稿では, 医療用テキストの完全性, 簡潔性, 帰属性を評価するための指標セットを提案する。
メトリクスは、インストラクションフォロー(プロプライエタリとオープンソースの両方)や教師付きエンタテインメントモデルなど、さまざまなタイプの評価者によって計算できる。
総合的な人間の研究によると、DocLensは既存の指標よりも医療専門家の判断とかなり高い一致を示している。
論文 参考訳(メタデータ) (2023-11-16T05:32:09Z) - Transformer-based classification of user queries for medical consultancy
with respect to expert specialization [4.124390946636936]
本稿では,RuBERTモデルを用いた医療相談分野におけるユーザからの問い合わせを分類するための革新的な戦略を提案する。
我々は,クエリと特定の医療専門知識の正確な対応を容易にする様々なデータセット上で,事前学習したRuBERTモデルを微調整した。
論文 参考訳(メタデータ) (2023-09-26T04:36:12Z) - MedGPTEval: A Dataset and Benchmark to Evaluate Responses of Large
Language Models in Medicine [16.75133391080187]
総合的な文献レビューに基づいて評価基準のセットを設計する。
既存の候補基準は、医学と工学の専門家5名によるデルファイ法の使用に最適化されている。
3つのチャットボットが評価され、OpenAIのChatGPT、BaiduのERNIEボット、上海人工知能研究所のDr. PuJiang(Dr.PJ)が評価されている。
論文 参考訳(メタデータ) (2023-05-12T09:37:13Z) - Informing clinical assessment by contextualizing post-hoc explanations
of risk prediction models in type-2 diabetes [50.8044927215346]
本研究は, 合併症リスク予測のシナリオを考察し, 患者の臨床状態に関する文脈に焦点を当てる。
我々は、リスク予測モデル推論に関する文脈を提示し、その受容性を評価するために、最先端のLLMをいくつか採用する。
本論文は,実世界における臨床症例における文脈説明の有効性と有用性を明らかにする最初のエンドツーエンド分析の1つである。
論文 参考訳(メタデータ) (2023-02-11T18:07:11Z) - Conditional Generation Net for Medication Recommendation [73.09366442098339]
医薬推奨は、患者の診断に従って適切な薬セットを提供することを目標としており、これは診療所において重要な課題である。
医薬品群を生成するための新しいコピー・アンド・予測機構を導入した条件生成ネット(COGNet)を提案する。
提案手法を公開MIMICデータセット上で検証し,実験結果から,提案手法が最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-02-14T10:16:41Z) - Semi-Supervised Variational Reasoning for Medical Dialogue Generation [70.838542865384]
医療対話生成には,患者の状態と医師の行動の2つの重要な特徴がある。
医療対話生成のためのエンドツーエンドの変分推論手法を提案する。
行動分類器と2つの推論検出器から構成される医師政策ネットワークは、拡張推論能力のために提案される。
論文 参考訳(メタデータ) (2021-05-13T04:14:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。