論文の概要: Baichuan-M4: A Clinical-Grade Medical Agent System for Continuous Care
- arxiv url: http://arxiv.org/abs/2606.08982v1
- Date: Mon, 08 Jun 2026 03:27:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.681265
- Title: Baichuan-M4: A Clinical-Grade Medical Agent System for Continuous Care
- Title(参考訳): Baichuan-M4 : 連続治療のための臨床用グレードメディカルエージェントシステム
- Authors: Aiyuan Yang, Chengfeng Dou, Da Pan, Dian Wang, Fan Yang, Fei Deng, Fei Li, Guangwei Ai, Hui Liu, Hongda Zhang, Jinyang Tai, Kai Lu, Lijun Liu, Linwei Chen, Linyu Li, Meiqing Guo, Peidong Guo, Qiang Ju, Rihui Xin, Shuai Wang, XinKai Ma, Xudong Chen, Yichuan Mo, Canbin Piao, Leyi Pan, Yihe Luo, Zian Wang,
- Abstract要約: バイチュアンM4(Baichuan-M4)は、バイチュアン・インテリジェンスの医療用医療用大型モデルである。
単ターンの医療質問応答ではなく、不連続なケアのために設計されている。
- 参考スコア(独自算出の注目度): 41.197268624942346
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Baichuan-M4 is Baichuan Intelligence's clinical-grade medical large model, designed for \emph{continuous care} rather than single-turn medical question answering. It is built as a coordinated medical agent system around three pillars: \textbf{Baichuan-Harness}, a unified runtime that keeps reinforcement-learning training and real-world deployment consistent while enforcing action constraints, tool use, long-term patient memory, and multi-agent coordination; a \textbf{core reasoning model} trained with a continuous-care reinforcement-learning framework that integrates span-level reward modeling (SPAR++), reasoning-path compression, curriculum learning, and stabilized policy optimization; and a \textbf{clinical tool layer} for patient-memory management, authoritative evidence-based retrieval, and multimodal medical perception across documents, X-rays, and dermatology. On a cross-dimensional medical evaluation suite, Baichuan-M4 attains leading results in static medical knowledge and safety, dynamic OSCE-style consultation, long-context clinical memory, evidence-based retrieval, medical document OCR, and multimodal image understanding, while lowering the hallucination rate to 3.3\%.
- Abstract(参考訳): バイチュアンM4(Baichuan-M4)は、ベイチュアン・インテリジェンス(Baichuan Intelligence)の医療用大型モデルで、単ターンの医療用質問応答ではなく「emph{continuous care'」用に設計された。
アクション制約、ツールの使用、長期の患者メモリ、マルチエージェントの調整を実施しながら、強化学習トレーニングと実世界のデプロイを一貫して維持する統合ランタイムである \textbf{Baichuan-Harness} 、スパンクレベルの報酬モデリング(SPAR++)、推論パス圧縮、カリキュラム学習、安定化されたポリシー最適化を統合した継続的ケア強化学習フレームワークで訓練された \textbf{core reasoning model 、患者メモリ管理のための \textbf{clinical tools layer} 、権威のあるエビデンスベースの検索、文書間のマルチモーダルな医学的認識、X線、皮膚科学である。
静的な医療知識と安全性、OSCEスタイルの動的コンサルテーション、長期臨床記憶、エビデンスベースの検索、医療文書のOCR、マルチモーダル画像理解、そして幻覚率を3.3\%に下げる。
関連論文リスト
- MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - MedForget: Hierarchy-Aware Multimodal Unlearning Testbed for Medical AI [66.0701326117134]
MedForgetは、階層型を意識したマルチモーダルなアンラーニングテストベッドで、準拠する医療AIシステムを構築する。
既存の手法は,診断性能を低下させることなく,完全かつ階層性に配慮した忘れの解決に苦慮していることを示す。
階層レベルのコンテキストをプロンプトに徐々に追加する再構成攻撃を導入する。
論文 参考訳(メタデータ) (2025-12-10T17:55:06Z) - MedKGEval: A Knowledge Graph-Based Multi-Turn Evaluation Framework for Open-Ended Patient Interactions with Clinical LLMs [19.12790150016383]
MedKGEvalは、臨床用大規模言語モデルのための新しいマルチターン評価フレームワークである。
知識グラフ駆動患者シミュレーション機構は、キュレートされた知識グラフから関連する医療事実を検索する。
ターンレベル評価フレームワークは、各モデル応答を臨床的適切性、事実的正当性、安全性について評価する。
論文 参考訳(メタデータ) (2025-10-14T07:22:26Z) - Triplet-Structured Knowledge Integration for Multi-Turn Medical Reasoning [21.44813166265882]
大規模言語モデル(LLM)は静的医療質問応答(QA)タスクにおいて高いパフォーマンスを示している。
本稿では,LLMの推論信頼性を高める三重構造アプローチであるTriMediQを紹介する。
2つのインタラクティブな医療QAベンチマークの実験によると、TriMediQは既存の5つのベースラインよりも最大10.4%精度が向上している。
論文 参考訳(メタデータ) (2025-10-03T22:11:17Z) - Baichuan-M2: Scaling Medical Capability with Large Verifier System [40.86227022086866]
静的解答検証を超越した,新しい動的検証フレームワークを提案する。
多段階強化学習戦略によって訓練された医療強化推論モデルBaichuan-M2を開発した。
HealthBenchでの評価では、Baichuan-M2は、他のすべてのオープンソースモデルや、最も高度なクローズドソースモデルよりも優れています。
論文 参考訳(メタデータ) (2025-09-02T11:23:35Z) - MEDMKG: Benchmarking Medical Knowledge Exploitation with Multimodal Knowledge Graph [28.79000907242469]
医用マルチモーダル知識グラフであるMEDMKGを提案する。
我々は,3つのタスクにまたがるMEDMKGを2つの実験的な設定で評価し,24のベースライン法と4つの最先端のビジョン言語バックボーンを6つのデータセットでベンチマークした。
その結果,MEDMKGは下流医療タスクの性能向上だけでなく,医療人工知能におけるマルチモーダル知識統合のための適応的かつ堅牢な戦略開発のための強力な基盤を提供することがわかった。
論文 参考訳(メタデータ) (2025-05-22T18:41:46Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice with Interactive Sequence [68.05876437208505]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - MedKP: Medical Dialogue with Knowledge Enhancement and Clinical Pathway
Encoding [48.348511646407026]
本稿では,知識向上と臨床パスウェイ符号化フレームワークを用いた医療対話について紹介する。
このフレームワークは、医療知識グラフを介して外部知識増強モジュールと、医療機関および医師の行動を介して、内部臨床経路をコードする。
論文 参考訳(メタデータ) (2024-03-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。