論文の概要: Benchmarking a foundation LLM on its ability to re-label structure names
in accordance with the AAPM TG-263 report
- arxiv url: http://arxiv.org/abs/2310.03874v1
- Date: Thu, 5 Oct 2023 20:10:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-10 06:33:45.197171
- Title: Benchmarking a foundation LLM on its ability to re-label structure names
in accordance with the AAPM TG-263 report
- Title(参考訳): aapm tg-263報告に基づく構造名称の再ラベル能力に関する基礎llmのベンチマーク
- Authors: Jason Holmes, Lian Zhang, Yuzhen Ding, Hongying Feng, Zhengliang Liu,
Tianming Liu, William W. Wong, Sujay A. Vora, Jonathan B. Ashman, Wei Liu
- Abstract要約: この研究は、大きな言語モデル(LLM)を使って構造名を再ラベルする概念を導入している。
前立腺、頭頸部、胸郭の正常組織は96.4%であった。
- 参考スコア(独自算出の注目度): 17.30867377719795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Purpose: To introduce the concept of using large language models (LLMs) to
re-label structure names in accordance with the American Association of
Physicists in Medicine (AAPM) Task Group (TG)-263 standard, and to establish a
benchmark for future studies to reference.
Methods and Materials: The Generative Pre-trained Transformer (GPT)-4
application programming interface (API) was implemented as a Digital Imaging
and Communications in Medicine (DICOM) storage server, which upon receiving a
structure set DICOM file, prompts GPT-4 to re-label the structure names of both
target volumes and normal tissues according to the AAPM TG-263. Three disease
sites, prostate, head and neck, and thorax were selected for evaluation. For
each disease site category, 150 patients were randomly selected for manually
tuning the instructions prompt (in batches of 50) and 50 patients were randomly
selected for evaluation. Structure names that were considered were those that
were most likely to be relevant for studies utilizing structure contours for
many patients.
Results: The overall re-labeling accuracy of both target volumes and normal
tissues for prostate, head and neck, and thorax cases was 96.0%, 98.5%, and
96.9% respectively. Re-labeling of target volumes was less accurate on average
except for prostate - 100%, 93.1%, and 91.1% respectively.
Conclusions: Given the accuracy of GPT-4 in re-labeling structure names of
both target volumes and normal tissues as presented in this work, LLMs are
poised to be the preferred method for standardizing structure names in
radiation oncology, especially considering the rapid advancements in LLM
capabilities that are likely to continue.
- Abstract(参考訳): 目的:米国医学会 (AAPM) タスクグループ (TG)-263 標準に従って, 大規模言語モデル (LLM) を用いて構造名をリラベルする概念を導入し, 今後の研究のためのベンチマークを確立すること。
方法と材料: 生成前訓練トランスフォーマ(gpt)-4 アプリケーションプログラミングインタフェース(api)は、dicom(digital imaging and communications in medicine)ストレージサーバとして実装され、構造セットdicomファイルを受信すると、apm tg-263に従って標的ボリュームと正常組織の両方の構造名をラベル付けするようにgpt-4に促される。
評価には前立腺, 頭頸部, 胸腺の3つの疾患部位が選択された。
各疾患部位では,手動で指示プロンプトを調整した患者150名(バッチ50名)をランダムに選択し,評価のためにランダムに50名とした。
構造名は、多くの患者にとって構造輪郭を利用した研究に最も関連があると考えられるものである。
結果: 前立腺, 頭頸部, 胸部に対する標的容積および正常組織は, それぞれ96.0%, 98.5%, 96.9%であった。
ターゲットボリュームの再ラベルは,100%,93.1%,91.1%の前立腺を除いて,平均では精度が低かった。
結論: 本研究で提示されているように, 標的体積と正常組織の両方の構造名の再ラベルにおけるgpt-4の精度を考えると, llmは放射線腫瘍学において構造名を標準化するための好適な方法であると考えられる。
関連論文リスト
- oRetrieval Augmented Generation for 10 Large Language Models and its Generalizability in Assessing Medical Fitness [4.118721833273984]
大規模言語モデル(LLM)は医学的応用の可能性を示すが、専門的な臨床知識が欠如していることが多い。
Retrieval Augmented Generation (RAG)は、ドメイン固有の情報によるカスタマイズを可能にし、医療に適している。
本研究は,手術適応の判定と術前指導におけるRAGモデルの精度,整合性,安全性について検討した。
論文 参考訳(メタデータ) (2024-10-11T00:34:20Z) - GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.09501109871351]
LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
38の医療画像モダリティ、18の臨床関連タスク、18の部門、視覚質問回答(VQA)フォーマットの4つの知覚的粒度からなる284のデータセットで構成されている。
論文 参考訳(メタデータ) (2024-08-06T17:59:21Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Development and Testing of Retrieval Augmented Generation in Large
Language Models -- A Case Study Report [2.523433459887027]
Retrieval Augmented Generation (RAG)は、大規模言語モデル(LLM)におけるドメイン知識をカスタマイズするための有望なアプローチとして出現する。
LLM-RAGモデルを35の術前ガイドラインを用いて開発し,人為的反応に対して試験を行った。
このモデルでは平均15~20秒で回答が生成され、人間の要求する10分よりもはるかに速くなった。
論文 参考訳(メタデータ) (2024-01-29T06:49:53Z) - MRI-based classification of IDH mutation and 1p/19q codeletion status of
gliomas using a 2.5D hybrid multi-task convolutional neural network [0.18374319565577152]
グリオーマにおけるIsocitrate dehydrogenase変異と1p/19q符号欠失は重要な予後マーカーである。
我々の目標は、MRIからこれらの分子変化を非侵襲的に決定する人工知能ベースの手法を開発することであった。
2.5Dハイブリッド畳み込みニューラルネットワークは、腫瘍を同時に局在させ、その分子状態を分類するために提案された。
論文 参考訳(メタデータ) (2022-10-07T18:46:39Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - Statistical Dependency Guided Contrastive Learning for Multiple Labeling
in Prenatal Ultrasound [56.631021151764955]
標準平面認識は出生前超音波(US)スクリーニングにおいて重要な役割を担っている。
我々は,複数の標準平面と対応する解剖学的構造を同時に識別する,新しいマルチラベル学習手法を構築した。
論文 参考訳(メタデータ) (2021-08-11T06:39:26Z) - Multi-Label Annotation of Chest Abdomen Pelvis Computed Tomography Text
Reports Using Deep Learning [1.5701326192371183]
各種疾患, 臓器, 症例に応用可能なCT (Body Computed Tomography) 用マルチラベルアノテータを開発した。
我々は,放射線学テキストレポートから病名ラベルを抽出するルールベースのアルゴリズムを開発するために辞書手法を用いた。
RBA抽出ラベルを用いて注意誘導リカレントニューラルネットワーク(RNN)を訓練し、各臓器系に1つ以上の疾患や正常な疾患に陽性であるとして報告を分類した。
論文 参考訳(メタデータ) (2021-02-05T02:07:39Z) - Multilabel 12-Lead Electrocardiogram Classification Using Gradient
Boosting Tree Ensemble [64.29529357862955]
我々は,心電図の診断を分類するために,形態や信号処理機能に適合した勾配強化木のアンサンブルを用いたアルゴリズムを構築した。
各リードについて、心拍変動、PQRSTテンプレート形状、全信号波形から特徴を導出する。
各クラスに属するECGインスタンスの確率を予測するため、全12項目の特徴と合わせて、勾配を増す決定ツリーの集合に適合する。
論文 参考訳(メタデータ) (2020-10-21T18:11:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。