論文の概要: Updating the Minimum Information about CLinical Artificial Intelligence
(MI-CLAIM) checklist for generative modeling research
- arxiv url: http://arxiv.org/abs/2403.02558v1
- Date: Tue, 5 Mar 2024 00:27:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 16:38:39.822190
- Title: Updating the Minimum Information about CLinical Artificial Intelligence
(MI-CLAIM) checklist for generative modeling research
- Title(参考訳): 生成的モデリング研究のための臨床人工知能(mi-claim)チェックリストの更新
- Authors: Brenda Y. Miao, Irene Y. Chen, Christopher YK Williams, Jays\'on
Davidson, Augusto Garcia-Agundez, Harry Sun, Travis Zack, Atul J. Butte,
Madhumita Sushil
- Abstract要約: 大規模言語モデル(LLM)を含む生成モデルの最近の進歩は、医学における自然言語と画像処理の分野を加速させてきた。
これらのモデルは、新しいタスクに非常に適応し、その使い方をスケーリングし、評価することで、新しい課題が浮かび上がっている。
我々は,トレーニング,評価,解釈可能性,コホート選択の報告の違いを強調させる,オリジナルのチェックリストの修正を提案する。
- 参考スコア(独自算出の注目度): 3.388811865653411
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in generative models, including large language models (LLMs),
vision language models (VLMs), and diffusion models, have accelerated the field
of natural language and image processing in medicine and marked a significant
paradigm shift in how biomedical models can be developed and deployed. While
these models are highly adaptable to new tasks, scaling and evaluating their
usage presents new challenges not addressed in previous frameworks. In
particular, the ability of these models to produce useful outputs with little
to no specialized training data ("zero-" or "few-shot" approaches), as well as
the open-ended nature of their outputs, necessitate the development of updated
guidelines in using and evaluating these models. In response to gaps in
standards and best practices for the development of clinical AI tools
identified by US Executive Order 141103 and several emerging national networks
for clinical AI evaluation, we begin to formalize some of these guidelines by
building on the "Minimum information about clinical artificial intelligence
modeling" (MI-CLAIM) checklist. The MI-CLAIM checklist, originally developed in
2020, provided a set of six steps with guidelines on the minimum information
necessary to encourage transparent, reproducible research for artificial
intelligence (AI) in medicine. Here, we propose modifications to the original
checklist that highlight differences in training, evaluation, interpretability,
and reproducibility of generative models compared to traditional AI models for
clinical research. This updated checklist also seeks to clarify cohort
selection reporting and adds additional items on alignment with ethical
standards.
- Abstract(参考訳): 大規模言語モデル(llms)、視覚言語モデル(vlms)、拡散モデルを含む生成モデルの最近の進歩は、医学における自然言語と画像処理の分野を加速させ、生物医学モデルの開発と展開の方法に大きなパラダイムシフトをもたらした。
これらのモデルは、新しいタスクに非常に適応できるが、その使い方のスケーリングと評価は、以前のフレームワークでは対処できなかった新しい課題を示す。
特に、特別なトレーニングデータ("zero-" または "few-shot" アプローチ)をほとんど持たない有用なアウトプットを生成するためのこれらのモデルの能力と、アウトプットの開放された性質は、これらのモデルの使用と評価に更新されたガイドラインの開発を必要とする。
米国大統領令141103および臨床AI評価のための新興国ネットワークによって特定される臨床AIツールの開発における標準とベストプラクティスのギャップに対応するため、我々は「臨床人工知能モデリングに関する最小情報」(MI-CLAIM)チェックリストに基づいてこれらのガイドラインの一部を策定し始める。
2020年に開発されたmi-claim checklistは、医療における人工知能(ai)の透明で再現可能な研究を促進するために必要な最小限の情報に関するガイドラインを6つのステップで提供した。
本稿では, 臨床研究における従来のAIモデルと比較して, 学習, 評価, 解釈可能性, 再現性の違いを強調したチェックリストの変更を提案する。
この更新されたチェックリストは、コホート選択報告の明確化や、倫理的基準に沿った追加項目の追加も目指している。
関連論文リスト
- Health AI Developer Foundations [18.690656891269686]
Health AI Developer Foundations(HAI-DEF)は、トレーニング済み、ドメイン固有の基礎モデル、ツール、レシピのスイートで、ヘルスアプリケーションのための機械学習の構築を加速する。
モデルは、放射線学(X線とCT)、病理学、皮膚画像、オーディオなど、様々なモダリティや領域をカバーする。
これらのモデルは、ラベル付きデータが少なく、トレーニング時間が短く、計算コストが削減されたAI開発を容易にする、ドメイン固有の埋め込みを提供する。
論文 参考訳(メタデータ) (2024-11-22T18:51:51Z) - LLaVA Needs More Knowledge: Retrieval Augmented Natural Language Generation with Knowledge Graph for Explaining Thoracic Pathologies [3.2221734920470797]
医用画像のための自然言語記述(NLE)を生成するために,知識グラフ(KG)ベースのデータストアを付加したビジョンランゲージフレームワークを提案する。
本フレームワークでは,生成した説明の精度を向上するだけでなく,直接データ検索を回避してデータのプライバシーを保護できるKGベースの検索機構を採用している。
これらのフレームワークはMIMIC-NLEデータセット上で検証され、最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-10-07T04:59:08Z) - Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Assessing Reusability of Deep Learning-Based Monotherapy Drug Response Prediction Models Trained with Omics Data [43.57729817547386]
がん薬物応答予測モデルは、精度オンコロジーへの有望なアプローチを示す。
深層学習(DL)法はこの分野で大きな可能性を秘めている。
これは、より広い科学コミュニティによって改善され、テストされる、再利用可能で適応可能なモデルの必要性を強調している。
論文 参考訳(メタデータ) (2024-09-18T16:08:28Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Intensive Care as One Big Sequence Modeling Problem [1.6114012813668932]
本稿では、患者と医療提供者とのインタラクションをイベントストリームとして表現する、シーケンスモデリングとしてのヘルスケアのパラダイムを提案する。
我々はMIMIC-IVデータセットから一様イベントストリームフォーマットに異種臨床記録を変換したシーケンスモデリングベンチマークMIMIC-SEQを開発した。
論文 参考訳(メタデータ) (2024-02-27T13:36:55Z) - The Shaky Foundations of Clinical Foundation Models: A Survey of Large
Language Models and Foundation Models for EMRs [5.7482228499062975]
非イメージングEMRデータに基づいて訓練された80以上の基礎モデルをレビューする。
ほとんどのモデルが、小さく、狭められた臨床データセットでトレーニングされていることが分かりました。
臨床基礎モデルの利点を評価するための評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-22T23:54:14Z) - Competence-based Multimodal Curriculum Learning for Medical Report
Generation [98.10763792453925]
本稿では,コンピテンスベースのマルチモーダルカリキュラム学習フレームワーク(CMCL)を提案する。
具体的には、CMCLは放射線学者の学習過程をシミュレートし、段階的にモデルを最適化する。
パブリックIU-XrayとMIMIC-CXRデータセットの実験は、CMCLを既存のモデルに組み込んでパフォーマンスを向上させることができることを示している。
論文 参考訳(メタデータ) (2022-06-24T08:16:01Z) - ICDBigBird: A Contextual Embedding Model for ICD Code Classification [71.58299917476195]
文脈単語埋め込みモデルは、複数のNLPタスクにおいて最先端の結果を得た。
ICDBigBirdは、Graph Convolutional Network(GCN)を統合するBigBirdベースのモデルである。
ICD分類作業におけるBigBirdモデルの有効性を実世界の臨床データセットで実証した。
論文 参考訳(メタデータ) (2022-04-21T20:59:56Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。