Fugu-MT 論文翻訳(概要): Evaluating large language models in medical applications: a survey

論文の概要: Evaluating large language models in medical applications: a survey

arxiv url: http://arxiv.org/abs/2405.07468v1
Date: Mon, 13 May 2024 05:08:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-14 14:54:35.733527
Title: Evaluating large language models in medical applications: a survey
Title（参考訳）: 医療応用における大規模言語モデルの評価--アンケート調査から
Authors: Xiaolan Chen, Jiayang Xiang, Shanfu Lu, Yexin Liu, Mingguang He, Danli Shi,
Abstract要約: 大規模言語モデル(LLM)は、多くのドメインにまたがる変換可能性を持つ強力なツールとして登場した。医学的文脈におけるLCMのパフォーマンスを評価することは、医療情報の複雑で批判的な性質から、ユニークな課題を提示する。
参考スコア（独自算出の注目度）: 1.5923327069574245
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Large language models (LLMs) have emerged as powerful tools with transformative potential across numerous domains, including healthcare and medicine. In the medical domain, LLMs hold promise for tasks ranging from clinical decision support to patient education. However, evaluating the performance of LLMs in medical contexts presents unique challenges due to the complex and critical nature of medical information. This paper provides a comprehensive overview of the landscape of medical LLM evaluation, synthesizing insights from existing studies and highlighting evaluation data sources, task scenarios, and evaluation methods. Additionally, it identifies key challenges and opportunities in medical LLM evaluation, emphasizing the need for continued research and innovation to ensure the responsible integration of LLMs into clinical practice.
Abstract（参考訳）: 大規模言語モデル(LLM)は、医療や医療など、多くの領域にわたる変革の可能性を持つ強力なツールとして登場した。医療分野では、LSMは臨床決定支援から患者教育まで幅広い課題を約束する。しかし, 医学的文脈におけるLCMの性能評価は, 医療情報の複雑で批判的な性質から, 独特な課題を呈している。本稿では,医学的LCM評価の展望を概観し,既存の研究から洞察を合成し,評価データソース,タスクシナリオ,評価方法の強調を行う。さらに、LSMの医療的評価における重要な課題と機会を特定し、LSMの臨床的実践への責任ある統合を保証するための継続的な研究と革新の必要性を強調している。

関連論文リスト

Med-CoDE: Medical Critique based Disagreement Evaluation Framework [72.42301910238861]
医学的文脈における大きな言語モデル(LLM)の信頼性と精度は依然として重要な懸念点である。現在の評価手法はロバスト性に欠けることが多く、LLMの性能を総合的に評価することができない。我々は,これらの課題に対処するために,医療用LCMの特別設計評価フレームワークであるMed-CoDEを提案する。
論文参考訳（メタデータ） (2025-04-21T16:51:11Z)
Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。本稿では,構造化医療推論を利用した新しいアプローチを提案する。我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文参考訳（メタデータ） (2025-03-05T05:24:55Z)
A Survey of LLM-based Agents in Medicine: How far are we from Baymax? [44.97640611811786]
大規模言語モデル(LLM)は、LLMベースのエージェントの開発を通じて医療を変革している。この調査は、医学におけるLSMベースのエージェントの総合的なレビューを提供する。医療エージェントシステムの主要な構成要素として, システムプロファイル, 臨床計画機構, 医療推論フレームワーク, 外的能力向上などについて分析する。
論文参考訳（メタデータ） (2025-02-16T17:21:05Z)
A Survey of Medical Vision-and-Language Applications and Their Techniques [48.268198631277315]
医療ビジョン・アンド・ランゲージモデル(MVLM)は、複雑な医療データを解釈するための自然言語インタフェースを提供する能力から、大きな関心を集めている。本稿では,MVLMの概要と適用した各種医療課題について概観する。また、これらのタスクに使用するデータセットについても検討し、標準化された評価指標に基づいて異なるモデルの性能を比較した。
論文参考訳（メタデータ） (2024-11-19T03:27:05Z)
Demystifying Large Language Models for Medicine: A Primer [50.83806796466396]
大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文参考訳（メタデータ） (2024-10-24T15:41:56Z)
CliMedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models in Clinical Scenarios [50.032101237019205]
CliMedBenchは、14のエキスパートによるコア臨床シナリオを備えた総合的なベンチマークである。このベンチマークの信頼性はいくつかの点で確認されている。
論文参考訳（メタデータ） (2024-10-04T15:15:36Z)
The Role of Language Models in Modern Healthcare: A Comprehensive Review [2.048226951354646]
医療における大規模言語モデル(LLM)の適用は注目されている。本稿では,言語モデルの初期から現在までの軌跡を概観する。
論文参考訳（メタデータ） (2024-09-25T12:15:15Z)
From Text to Multimodality: Exploring the Evolution and Impact of Large Language Models in Medical Practice [12.390859712280328]
大規模言語モデル(LLM)は、テキストベースのシステムからマルチモーダルプラットフォームへと急速に進化してきた。医療におけるMLLMの現況を考察し,臨床診断支援,医用画像,患者エンゲージメント,研究の分野にまたがる応用を分析した。
論文参考訳（メタデータ） (2024-09-14T02:35:29Z)
Large Language Models in Biomedical and Health Informatics: A Review with Bibliometric Analysis [24.532570258954898]
大規模言語モデル(LLM)は、バイオメディカル・ヘルスインフォマティクス(BHI)において、急速に重要なツールになりつつある。本研究の目的は、BHIにおけるLLM応用の総合的な概要を提供し、その変容の可能性を強調し、関連する倫理的・実践的課題に対処することである。
論文参考訳（メタデータ） (2024-03-24T21:29:39Z)
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文参考訳（メタデータ） (2024-02-15T06:46:48Z)
MedBench: A Large-Scale Chinese Benchmark for Evaluating Medical Large Language Models [56.36916128631784]
中国の医療分野の総合的なベンチマークであるMedBenchを紹介する。このベンチマークは、中国の医療ライセンス試験、居住者標準化訓練試験、および現実世界のクリニックの4つの主要なコンポーネントで構成されている。幅広い実験を行い, 多様な視点から詳細な分析を行い, 以下の結果を得た。
論文参考訳（メタデータ） (2023-12-20T07:01:49Z)
Large language models in healthcare and medical domain: A review [4.456243157307507]
大規模言語モデル(LLM)は、自由テキストクエリに対する熟練した応答を提供する。このレビューでは、多様な医療応用の効率性と効果を増幅するLLMの可能性について考察する。
論文参考訳（メタデータ） (2023-12-12T20:54:51Z)
A Survey of Large Language Models in Medicine: Progress, Application, and Challenge [85.09998659355038]
大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文参考訳（メタデータ） (2023-11-09T02:55:58Z)
Large Language Models Illuminate a Progressive Pathway to Artificial Healthcare Assistant: A Review [16.008511195589925]
大規模言語モデル(LLM)は、人間のレベルの言語理解と推論を模倣する有望な能力を示している。本稿では,医学におけるLSMの応用と意義について概説する。
論文参考訳（メタデータ） (2023-11-03T13:51:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。