論文の概要: Statistics, Not Scale: Modular Medical Dialogue with Bayesian Belief Engine
- arxiv url: http://arxiv.org/abs/2604.20022v1
- Date: Tue, 21 Apr 2026 21:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.869978
- Title: Statistics, Not Scale: Modular Medical Dialogue with Bayesian Belief Engine
- Title(参考訳): 統計, スケールではなく: ベイジアン・リーフ・エンジンを用いたモジュラー医療対話
- Authors: Yusuf Kesmen, Fay Elhassan, Jiayi Ma, Julien Stalhandske, David Sasu, Alexandra Kulinkina, Akhil Arora, Lars Klein, Mary-Anne Hartley,
- Abstract要約: 大規模言語モデルは、自律的な診断エージェントとしてますますデプロイされているが、基本的に異なる2つの機能を説明する。
本稿では,言語と推論を厳格に分離するモジュール型診断対話フレームワークBMBEを紹介する。
- 参考スコア(独自算出の注目度): 51.722324399751294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models are increasingly deployed as autonomous diagnostic agents, yet they conflate two fundamentally different capabilities: natural-language communication and probabilistic reasoning. We argue that this conflation is an architectural flaw, not an engineering shortcoming. We introduce BMBE (Bayesian Medical Belief Engine), a modular diagnostic dialogue framework that enforces a strict separation between language and reasoning: an LLM serves only as a sensor, parsing patient utterances into structured evidence and verbalising questions, while all diagnostic inference resides in a deterministic, auditable Bayesian engine. Because patient data never enters the LLM, the architecture is private by construction; because the statistical backend is a standalone module, it can be replaced per target population without retraining. This separation yields three properties no autonomous LLM can offer: calibrated selective diagnosis with a continuously adjustable accuracy-coverage tradeoff, a statistical separation gap where even a cheap sensor paired with the engine outperforms a frontier standalone model from the same family at a fraction of the cost, and robustness to adversarial patient communication styles that cause standalone doctors to collapse. We validate across empirical and LLM-generated knowledge bases against frontier LLMs, confirming the advantage is architectural, not informational.
- Abstract(参考訳): 大規模言語モデルは、自律的な診断エージェントとしてますますデプロイされているが、自然言語通信と確率論的推論という、根本的に異なる2つの能力が説明されている。
この妥協はアーキテクチャ上の欠陥であり、エンジニアリングの欠点ではない、と私たちは主張する。
我々はBMBE(Bayesian Medical Belief Engine)という,言語と推論の厳密な分離を強制するモジュール型診断対話フレームワークを紹介した。
患者データがLSMに入ることはないため、アーキテクチャは構成上はプライベートである。
この分離は、連続的に調整可能な精度被覆トレードオフによる選択診断の校正、エンジンとペアリングされた安価なセンサーでさえ、同じ家族から少しのコストでフロンティアスタンドアロンモデルより優れている統計的分離ギャップ、スタンドアローンの医師を崩壊させる敵の患者通信スタイルに対する堅牢性、の3つの特性をもたらす。
我々は、実証的知識ベースとLLM生成知識ベースを、フロンティアLSMに対して検証し、その利点はアーキテクチャであり、情報的ではないことを確認した。
関連論文リスト
- SymptomWise: A Deterministic Reasoning Layer for Reliable and Efficient AI Systems [0.9786690381850356]
本稿では,言語理解と診断的推論を分離するフレームワークであるSyptomWiseを紹介する。
このシステムは、専門家による医療知識、決定論的コーデックス駆動推論、および大規模言語モデルの制約付き使用を組み合わせる。
このアーキテクチャはトレーサビリティを改善し、不要な結論を減らし、システムコンポーネントのモジュラー評価を可能にする。
論文 参考訳(メタデータ) (2026-04-07T19:00:53Z) - IV Co-Scientist: Multi-Agent LLM Framework for Causal Instrumental Variable Discovery [61.15184885636171]
内因性変数と結果との相同性の存在下では、インストゥルメンタル変数(IVs)を用いて内因性変数の因果効果を分離する。
大規模言語モデル(LLM)がこの課題に有効かどうかを検討する。
本稿では,多エージェントシステムであるIV Co-Scientistを紹介する。
論文 参考訳(メタデータ) (2026-02-08T12:28:29Z) - Evaluating an evidence-guided reinforcement learning framework in aligning light-parameter large language models with decision-making cognition in psychiatric clinical reasoning [29.976546632432512]
大規模言語モデル(LLM)は、医学的意思決定を支援するための変革的な可能性を持っているが、その精神医学への応用は幻覚や表面的推論によって制限されている。
本稿では,LLMの内部推論と専門的な精神医学的実践の整合性を考慮した強化学習フレームワークであるClinMPOを紹介する。
論文 参考訳(メタデータ) (2026-02-06T07:21:08Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Task-Awareness Improves LLM Generations and Uncertainty [48.857040212979484]
ベイズ最適応答は、ビームサーチのような標準的な復号法より一貫して優れている。
我々の決定論的なフレームワークは、潜在応答構造を持つあらゆる問題に適用できる。
論文 参考訳(メタデータ) (2026-01-29T10:16:23Z) - Standardization of Psychiatric Diagnoses -- Role of Fine-tuned LLM Consortium and OpenAI-gpt-oss Reasoning LLM Enabled Decision Support System [3.629588822458722]
本稿では,LLM対応意思決定支援システムについて,LLMコンソーシアムとOpenAI-gpt-oss Reasoning LLM対応意思決定支援システムを提案する。
個々のモデルからの診断予測は、コンセンサスに基づく意思決定プロセスを通じて集約される。
提案されたプラットフォームのプロトタイプは、バージニア州ノーフォークのアメリカ陸軍医療研究チームと共同で開発された。
論文 参考訳(メタデータ) (2025-10-29T14:54:22Z) - CANDLE: A Cross-Modal Agentic Knowledge Distillation Framework for Interpretable Sarcopenia Diagnosis [3.0245458192729466]
CANDLEは、解釈可能性と性能のトレードオフを緩和し、予測精度を高め、高い決定一貫性を維持する。
このフレームワークは、TMLモデルの知識アセット化に対するスケーラブルなアプローチを提供し、サルコピアおよび潜在的に広い医療領域における解釈可能、再現可能、および臨床的に整合した意思決定支援を可能にする。
論文 参考訳(メタデータ) (2025-07-26T15:50:08Z) - DocCHA: Towards LLM-Augmented Interactive Online diagnosis System [17.975659876934895]
DocCHAは、診断プロセスを3段階に分解することで臨床推論をエミュレートする、信頼性に配慮したモジュラーなフレームワークである。
実世界の中国のコンサルティングデータセットを2つ評価した。
論文 参考訳(メタデータ) (2025-07-10T15:52:04Z) - STRICTA: Structured Reasoning in Critical Text Assessment for Peer Review and Beyond [68.47402386668846]
本研究では,テキストアセスメントをステップワイド推論プロセスとしてモデル化するために,Structured Reasoning In Critical Text Assessment (STRICTA)を導入する。
STRICTAは、因果性理論に基づく相互接続推論ステップのグラフに評価を分解する。
約40人のバイオメディカル専門家が20以上の論文について4000以上の推論ステップのデータセットにSTRICTAを適用した。
論文 参考訳(メタデータ) (2024-09-09T06:55:37Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。