論文の概要: Large Language Models Perform Diagnostic Reasoning
- arxiv url: http://arxiv.org/abs/2307.08922v1
- Date: Tue, 18 Jul 2023 01:43:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 16:51:29.176831
- Title: Large Language Models Perform Diagnostic Reasoning
- Title(参考訳): 診断推論を行う大規模言語モデル
- Authors: Cheng-Kuang Wu, Wei-Lin Chen, Hsin-Hsi Chen
- Abstract要約: 医師の根底にある推論プロセスに動機づけられた診断推論CoT(DR-CoT)を提示する
実験結果から,DR-CoTを2つ導入した汎用テキストコーパスのみを用いて学習した大規模言語モデルに対して,診断精度を標準プロンプトよりも15%向上させることが示唆された。
- 参考スコア(独自算出の注目度): 19.545223275459506
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore the extension of chain-of-thought (CoT) prompting to medical
reasoning for the task of automatic diagnosis. Motivated by doctors' underlying
reasoning process, we present Diagnostic-Reasoning CoT (DR-CoT). Empirical
results demonstrate that by simply prompting large language models trained only
on general text corpus with two DR-CoT exemplars, the diagnostic accuracy
improves by 15% comparing to standard prompting. Moreover, the gap reaches a
pronounced 18% in out-domain settings. Our findings suggest expert-knowledge
reasoning in large language models can be elicited through proper promptings.
- Abstract(参考訳): 自動診断の課題に対する医学的推論を促すためのチェーン・オブ・シント(CoT)の拡張について検討する。
医師の根底にある推論プロセスに動機付けられ,診断推論CoT(DR-CoT)を提示する。
実験の結果, 2つのdr-cotexemplarを用いた一般的なテキストコーパスでのみトレーニングされた大規模言語モデルにプロンプトすることで, 診断精度が標準プロンプトと比較して15%向上することがわかった。
さらに、領域外設定では、ギャップは18%に達する。
以上の結果から,大規模言語モデルのエキスパート知識推論は適切なプロンプトによって引き起こされる可能性が示唆された。
関連論文リスト
- Ensuring Ground Truth Accuracy in Healthcare with the EVINCE framework [2.5200794639628032]
機械学習モデルによる誤ったラベル付きデータの臨床実践への伝播は容認できない。
本稿では,1)診断精度の向上を目的としたEVINCEと,2)誤診の修正とトレーニングデータエラーの最小化を目的としたシステムを提案する。
論文 参考訳(メタデータ) (2024-05-20T18:26:36Z) - Integrating Physician Diagnostic Logic into Large Language Models: Preference Learning from Process Feedback [19.564416963801268]
プロセスフィードバックから選好学習というアプローチを提案する。
PLPFは医師の診断ロジックをLSMに統合する。
PLPFは医療会話におけるベースラインモデルの診断精度を17.6%向上させる。
論文 参考訳(メタデータ) (2024-01-11T06:42:45Z) - Zero-shot Causal Graph Extrapolation from Text via LLMs [50.596179963913045]
我々は,自然言語から因果関係を推定する大規模言語モデル (LLM) の能力を評価する。
LLMは、(特別な)トレーニングサンプルを必要とせずにペア関係のベンチマークで競合性能を示す。
我々は、反復的なペアワイズクエリを通して因果グラフを外挿するアプローチを拡張した。
論文 参考訳(メタデータ) (2023-12-22T13:14:38Z) - Multi-Task Training with In-Domain Language Models for Diagnostic
Reasoning [5.321587036724933]
ドメイン内言語モデルとドメイン外言語モデルの比較分析を行い、マルチタスクと単一タスクトレーニングを比較した。
マルチタスクで臨床訓練を受けた言語モデルは、その一般ドメインよりも大きなマージンで優れていることを実証する。
論文 参考訳(メタデータ) (2023-06-07T15:55:34Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Semantic Coherence Markers for the Early Diagnosis of the Alzheimer
Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。
我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。
ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文 参考訳(メタデータ) (2023-02-02T11:40:16Z) - This Patient Looks Like That Patient: Prototypical Networks for
Interpretable Diagnosis Prediction from Clinical Text [56.32427751440426]
臨床実践においては、そのようなモデルは正確であるだけでなく、医師に解釈可能で有益な結果を与える必要がある。
本稿では,プロトタイプネットワークに基づく新しい手法であるProtoPatientを紹介する。
利用可能な2つの臨床データセット上でモデルを評価し、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-16T10:12:07Z) - Developing a general-purpose clinical language inference model from a
large corpus of clinical notes [0.30586855806896046]
カリフォルニア大学サンフランシスコ校(UCSF)で著述された7500万の同定された臨床記録を多種多様な同定コーパスを用いて,BERTモデルからBi Domain Decoderを訓練した。
本モデルは,UCSFデータを用いた2つのタスクのシステム内評価において,これらのモデルと同等の大きさのバイオメディカル言語モデルと同等の性能を発揮した。
論文 参考訳(メタデータ) (2022-10-12T20:08:45Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - Semi-Supervised Variational Reasoning for Medical Dialogue Generation [70.838542865384]
医療対話生成には,患者の状態と医師の行動の2つの重要な特徴がある。
医療対話生成のためのエンドツーエンドの変分推論手法を提案する。
行動分類器と2つの推論検出器から構成される医師政策ネットワークは、拡張推論能力のために提案される。
論文 参考訳(メタデータ) (2021-05-13T04:14:35Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。