論文の概要: Polaris: A Safety-focused LLM Constellation Architecture for Healthcare
- arxiv url: http://arxiv.org/abs/2403.13313v1
- Date: Wed, 20 Mar 2024 05:34:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 17:58:10.469788
- Title: Polaris: A Safety-focused LLM Constellation Architecture for Healthcare
- Title(参考訳): Polaris: 医療のための安全性を重視したLLMコンステレーションアーキテクチャ
- Authors: Subhabrata Mukherjee, Paul Gamble, Markel Sanz Ausin, Neel Kant, Kriti Aggarwal, Neha Manjunath, Debajyoti Datta, Zhengliang Liu, Jiayuan Ding, Sophia Busacca, Cezanne Bianco, Swapnil Sharma, Rae Lasko, Michelle Voisard, Sanchay Harneja, Darya Filippova, Gerry Meixiong, Kevin Cha, Amir Youssefi, Meyhaa Buvanesh, Howard Weingram, Sebastian Bierman-Lytle, Harpreet Singh Mangat, Kim Parikh, Saad Godil, Alex Miller,
- Abstract要約: Polarisは、リアルタイムの患者とAIの医療会話のための、安全に焦点を当てた初めてのLLMコンステレーションだ。
当社のモデルは、プロプライエタリなデータ、臨床ケア計画、医療規制文書、医療マニュアル、その他の医学推論文書に基づいてトレーニングします。
我々は、このシステムのエンドツーエンドの会話評価を行うために、1100人以上の米国免許看護師と130人以上の米国医師を募集した。
- 参考スコア(独自算出の注目度): 17.074456639617996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop Polaris, the first safety-focused LLM constellation for real-time patient-AI healthcare conversations. Unlike prior LLM works in healthcare focusing on tasks like question answering, our work specifically focuses on long multi-turn voice conversations. Our one-trillion parameter constellation system is composed of several multibillion parameter LLMs as co-operative agents: a stateful primary agent that focuses on driving an engaging conversation and several specialist support agents focused on healthcare tasks performed by nurses to increase safety and reduce hallucinations. We develop a sophisticated training protocol for iterative co-training of the agents that optimize for diverse objectives. We train our models on proprietary data, clinical care plans, healthcare regulatory documents, medical manuals, and other medical reasoning documents. We align our models to speak like medical professionals, using organic healthcare conversations and simulated ones between patient actors and experienced nurses. This allows our system to express unique capabilities such as rapport building, trust building, empathy and bedside manner. Finally, we present the first comprehensive clinician evaluation of an LLM system for healthcare. We recruited over 1100 U.S. licensed nurses and over 130 U.S. licensed physicians to perform end-to-end conversational evaluations of our system by posing as patients and rating the system on several measures. We demonstrate Polaris performs on par with human nurses on aggregate across dimensions such as medical safety, clinical readiness, conversational quality, and bedside manner. Additionally, we conduct a challenging task-based evaluation of the individual specialist support agents, where we demonstrate our LLM agents significantly outperform a much larger general-purpose LLM (GPT-4) as well as from its own medium-size class (LLaMA-2 70B).
- Abstract(参考訳): 我々は、患者とAIのリアルタイム医療会話のための、最初の安全に焦点を当てたLLMコンステレーションであるPolarisを開発した。
これまでのLLMでは、質問応答などのタスクに重点を置いていたのに対して、当社では、長いマルチターン音声会話に特化しています。
本システムでは,複数のマルチビリオンパラメータLLMを協調エージェントとして構成し,対話の促進に重点を置くステートフルプライマリエージェントと,看護師が行う医療タスクに重点を置く専門的支援エージェントを用いて,安全性の向上と幻覚の低減を図る。
多様な目的のために最適化されたエージェントの反復的協調訓練のための高度なトレーニングプロトコルを開発する。
当社のモデルは、プロプライエタリなデータ、臨床ケア計画、医療規制文書、医療マニュアル、その他の医学推論文書に基づいてトレーニングします。
当社のモデルは、医療専門家のように話し、オーガニックなヘルスケアの会話を使い、患者アクターと経験豊富な看護師の間でシミュレートする。
これにより、ラプポートビルディング、信頼ビルディング、共感、ベッドサイドマナーといったユニークな機能を表現することができる。
最後に,医療用LLMシステムの総合的臨床評価について紹介する。
私たちは、1100人以上の米国ライセンス看護師と130人以上の米国ライセンスの医師を雇い、患者を装い、いくつかの手段でシステムを評価することで、システムのエンドツーエンドの会話評価を行いました。
医療安全, 臨床準備性, 会話の質, ベッドサイドの仕方など, 人の看護婦と同等に働くことを実証した。
さらに, 個別支援エージェントの課題ベース評価を行い, LLMエージェントは, より大型の汎用LLM(GPT-4)と, 中型クラス(LLaMA-2 70B)を著しく上回っていることを実証した。
関連論文リスト
- PIORS: Personalized Intelligent Outpatient Reception based on Large Language Model with Multi-Agents Medical Scenario Simulation [37.62430767919014]
中国では、受付係の看護師は外来で圧倒的な負荷に直面し、各患者の時間と注意を制限している。
パーソナライズされた知的外来受容器システム(PIORS)について紹介する。
本システムは, LLMベースの受付看護師と, LLMと病院情報システム(HIS)の連携を実際の外来環境に統合する。
論文 参考訳(メタデータ) (2024-11-21T07:28:07Z) - Demystifying Large Language Models for Medicine: A Primer [50.83806796466396]
大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。
本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文 参考訳(メタデータ) (2024-10-24T15:41:56Z) - MedAide: Towards an Omni Medical Aide via Specialized LLM-based Multi-Agent Collaboration [16.062646854608094]
大規模言語モデル(LLM)による対話システムは、現在医療分野において潜在的に有望であることを示している。
本稿では,医療専門サービスのためのオムニ・メディカル・マルチエージェント・コラボレーション・フレームワークであるMedAideを提案する。
論文 参考訳(メタデータ) (2024-10-16T13:10:27Z) - Large Language Models in the Clinic: A Comprehensive Benchmark [63.21278434331952]
診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
まず、さまざまな臨床言語の生成、理解、推論タスクを含む11の既存のデータセットを収集します。
次に,現実の実践において複雑だが一般的である6つの新しいデータセットと臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文 参考訳(メタデータ) (2024-04-25T15:51:06Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - ChiMed-GPT: A Chinese Medical Large Language Model with Full Training Regime and Better Alignment to Human Preferences [51.66185471742271]
我々は中国医学領域向けに明示的に設計されたベンチマークLSMであるChiMed-GPTを提案する。
ChiMed-GPTは、事前訓練、SFT、RLHFを含む総合的な訓練体制を実施。
我々は,ChiMed-GPTを患者識別に関する態度尺度の実行を促すことによって,潜在的なバイアスを分析した。
論文 参考訳(メタデータ) (2023-11-10T12:25:32Z) - A Survey of Large Language Models in Medicine: Progress, Application, and Challenge [85.09998659355038]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。
本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文 参考訳(メタデータ) (2023-11-09T02:55:58Z) - Large Language Models Illuminate a Progressive Pathway to Artificial
Healthcare Assistant: A Review [16.008511195589925]
大規模言語モデル(LLM)は、人間のレベルの言語理解と推論を模倣する有望な能力を示している。
本稿では,医学におけるLSMの応用と意義について概説する。
論文 参考訳(メタデータ) (2023-11-03T13:51:36Z) - Talk2Care: Facilitating Asynchronous Patient-Provider Communication with
Large-Language-Model [29.982507402325396]
LLMを利用したコミュニケーションシステムTalk2Careを,高齢者と医療提供者向けに開発した。
高齢者に対しては,音声アシスタント(VA)の利便性とアクセシビリティを活用し,効果的な情報収集のためのLLMを利用したVAインタフェースを構築した。
その結果,Talk2Careはコミュニケーションプロセスを促進し,高齢者の健康情報を充実させ,提供者の努力と時間を著しく節約できることがわかった。
論文 参考訳(メタデータ) (2023-09-17T19:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。