Fugu-MT 論文翻訳(概要): Note2Chat: Improving LLMs for Multi-Turn Clinical History Taking Using Medical Notes

論文の概要: Note2Chat: Improving LLMs for Multi-Turn Clinical History Taking Using Medical Notes

arxiv url: http://arxiv.org/abs/2601.21551v1
Date: Thu, 29 Jan 2026 11:05:46 GMT
ステータス: 翻訳完了
システム内更新日: 2026-01-30 16:22:49.756453
Title: Note2Chat: Improving LLMs for Multi-Turn Clinical History Taking Using Medical Notes
Title（参考訳）: Note2Chat:医療用ノートを用いた多施設臨床史におけるLCMの改善
Authors: Yang Zhou, Zhenting Sheng, Mingrui Tan, Yuting Song, Jun Zhou, Yu Heng Kwan, Lian Leng Low, Yang Bai, Yong Liu,
Abstract要約: 医用ノートから学習することで, LLMを学習し, 構造化された履歴の取得と診断を行うためのノート駆動フレームワークを提案する。我々は,実世界の医療ノートを,意思決定木誘導型生成・改善パイプラインを用いて高品質な医師と患者との対話に変換する。また,一転推論問題の一列として歴史を再編成する新しい一転推論パラダイムを提案する。
参考スコア（独自算出の注目度）: 17.99778043736069
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Effective clinical history taking is a foundational yet underexplored component of clinical reasoning. While large language models (LLMs) have shown promise on static benchmarks, they often fall short in dynamic, multi-turn diagnostic settings that require iterative questioning and hypothesis refinement. To address this gap, we propose \method{}, a note-driven framework that trains LLMs to conduct structured history taking and diagnosis by learning from widely available medical notes. Instead of relying on scarce and sensitive dialogue data, we convert real-world medical notes into high-quality doctor-patient dialogues using a decision tree-guided generation and refinement pipeline. We then propose a three-stage fine-tuning strategy combining supervised learning, simulated data augmentation, and preference learning. Furthermore, we propose a novel single-turn reasoning paradigm that reframes history taking as a sequence of single-turn reasoning problems. This design enhances interpretability and enables local supervision, dynamic adaptation, and greater sample efficiency. Experimental results show that our method substantially improves clinical reasoning, achieving gains of +16.9 F1 and +21.0 Top-1 diagnostic accuracy over GPT-4o. Our code and dataset can be found at https://github.com/zhentingsheng/Note2Chat.
Abstract（参考訳）: 効果的な臨床履歴取得は、臨床推論の基礎的だが未解明の要素である。大規模言語モデル(LLM)は静的なベンチマークで有望であることを示しているが、しばしば、反復的な質問や仮説修正を必要とする動的でマルチターンの診断設定では不足している。このギャップに対処するために,広く利用可能な医療用ノートから学習することで,LCMに構造化された履歴の取得と診断を行うよう訓練するノート駆動のフレームワークである 'method{} を提案する。現実の医療用ノートは,少ない対話データやセンシティブな対話データに頼る代わりに,意思決定木誘導世代と改善パイプラインを用いて,高品質な医師と患者との対話に変換する。次に、教師付き学習、シミュレーションデータ拡張、嗜好学習を組み合わせた3段階の微調整戦略を提案する。さらに,一転推論問題の一列として歴史を再編成する新しい一転推論パラダイムを提案する。この設計は解釈可能性を高め、局所的な監視、動的適応、サンプル効率の向上を可能にする。その結果,GPT-4oより+16.9 F1,+21.0 Top-1の診断精度が向上した。私たちのコードとデータセットはhttps://github.com/zhentingsheng/Note2Chat.orgで確認できます。

関連論文リスト

A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T18:48:21Z)
Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文参考訳（メタデータ） (2025-10-11T16:24:35Z)
Fleming-R1: Toward Expert-Level Medical Reasoning via Reinforcement Learning [6.778254993886297]
Fleming-R1は、3つの相補的な革新を通じて、医学的推論を検証するために設計されたモデルである。まず、我々のReasoning-Oriented Data Strategy(RODS)は、キュレートされた医療用QAデータセットと知識グラフ誘導合成を組み合わせる。第2に,教師モデルから高品質な推論軌跡を蒸留するために,CoTコールドスタート(Chain-of-Thought)を用いる。第三に、検証可能なリワードフレームワークから2段階の強化学習を実装します。
論文参考訳（メタデータ） (2025-09-18T13:35:14Z)
AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs [0.0]
歩行障害は、神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を果たす。近年のディープラーニングベースのアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多い。本稿では、事前訓練されたVQ-VAEモーショントークンライザと、一対のモーショントークン上で微調整されたLarge Language Model(LLM)からなる新しいパイプラインであるAGIRを紹介する。
論文参考訳（メタデータ） (2025-03-23T17:12:16Z)
Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。本稿では,構造化医療推論を利用した新しいアプローチを提案する。我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文参考訳（メタデータ） (2025-03-05T05:24:55Z)
Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations [74.83732294523402]
実世界の診断シナリオをシミュレートし,USMLE標準に適合するノイズと難易度を統合する新しいベンチマークを導入する。また、対話に基づく微調整についても検討し、静的データセットを会話形式に変換し、反復的推論プロセスをよりよく捉える。実験の結果、対話調整されたモデルは従来の手法よりも優れており、マルチラウンド推論のシナリオでは9.64%、ノイズの多い環境では6.18%の精度で改善されている。
論文参考訳（メタデータ） (2025-01-29T18:58:48Z)
Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。 VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-29T23:19:28Z)
Few shot chain-of-thought driven reasoning to prompt LLMs for open ended medical question answering [24.43605359639671]
我々はMedQA-USMLEデータセットの修正版であるMedQA-OPENを提案する。臨床シナリオを模倣する選択肢のないオープンエンドの医療質問と、臨床者が承認した理性的な回答を含んでいる。思考の連鎖(CoT)推論(CLINICR)によって駆動されるプロンプトを実装し,漸進的推論の過程を反映する。
論文参考訳（メタデータ） (2024-03-07T20:48:40Z)
Assertion Detection Large Language Model In-context Learning LoRA Fine-tuning [2.401755243180179]
本稿では,大規模言語モデル(LLM)を多数の医療データに基づいて事前学習してアサーション検出を行う手法を提案する。提案手法は従来の手法よりも0.31高い0.74のF-1を達成した。
論文参考訳（メタデータ） (2024-01-31T05:11:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。