論文の概要: The Radiation Oncology NLP Database
- arxiv url: http://arxiv.org/abs/2401.10995v1
- Date: Fri, 19 Jan 2024 19:23:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 18:29:04.389804
- Title: The Radiation Oncology NLP Database
- Title(参考訳): 放射線腫瘍学nlpデータベース
- Authors: Zhengliang Liu, Jason Holmes, Wenxiong Liao, Chenbin Liu, Lian Zhang,
Hongying Feng, Peilong Wang, Muhammad Ali Elahi, Hongmin Cai, Lichao Sun,
Quanzheng Li, Xiang Li, Tianming Liu, Jiajian Shen, Wei Liu
- Abstract要約: 放射線オンコロジーのためのNLPデータセットとして,放射線オンコロジーNLPデータベース(ROND)を提案する。
RONDは放射線腫瘍学の領域におけるこのギャップに対処するために特別に設計された。
Logic Reasoning, Text Classification, Named Entity Recognition (NER), Question Answering (QA), Text Summarization, patient-Clinician Conversationsなど,さまざまなNLPタスクを含んでいる。
- 参考スコア(独自算出の注目度): 33.391114383354804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Radiation Oncology NLP Database (ROND), the first dedicated
Natural Language Processing (NLP) dataset for radiation oncology, an important
medical specialty that has received limited attention from the NLP community in
the past. With the advent of Artificial General Intelligence (AGI), there is an
increasing need for specialized datasets and benchmarks to facilitate research
and development. ROND is specifically designed to address this gap in the
domain of radiation oncology, a field that offers many opportunities for NLP
exploration. It encompasses various NLP tasks including Logic Reasoning, Text
Classification, Named Entity Recognition (NER), Question Answering (QA), Text
Summarization, and Patient-Clinician Conversations, each with a distinct focus
on radiation oncology concepts and application cases. In addition, we have
developed an instruction-tuning dataset consisting of over 20k instruction
pairs (based on ROND) and trained a large language model, CancerChat. This
serves to demonstrate the potential of instruction-tuning large language models
within a highly-specialized medical domain. The evaluation results in this
study could serve as baseline results for future research. ROND aims to
stimulate advancements in radiation oncology and clinical NLP by offering a
platform for testing and improving algorithms and models in a domain-specific
context. The ROND dataset is a joint effort of multiple U.S. health
institutions. The data is available at
https://github.com/zl-liu/Radiation-Oncology-NLP-Database.
- Abstract(参考訳): 本稿では,放射線腫瘍学のための最初の専用自然言語処理(nlp)データセットである放射線腫瘍学nlpデータベース(rond)について述べる。
agi(artificial general intelligence)の出現により、研究と開発を促進するために特別なデータセットとベンチマークの必要性が高まっている。
RONDは、NLP探査の多くの機会を提供する分野である放射線腫瘍学の領域において、このギャップに対処するために特別に設計された。
Logic Reasoning, Text Classification, Named Entity Recognition (NER), Question Answering (QA), Text Summarization, patient-Clinician Conversationsなど,さまざまなNLPタスクが含まれており,それぞれが放射線オンコロジーの概念や応用事例に重点を置いている。
さらに20万以上の命令ペア(rondに基づく)からなる命令チューニングデータセットを開発し,大規模な言語モデルである cancerchat をトレーニングした。
これは、高度に専門化された医療領域内で、大きな言語モデルを命令チューニングする可能性を示すのに役立つ。
本研究の評価結果は,今後の研究のベースラインとなるかもしれない。
RONDは、放射線腫瘍学と臨床NLPの進歩を促進すべく、ドメイン固有のコンテキストにおけるアルゴリズムとモデルのテストと改善のためのプラットフォームを提供する。
RONDデータセットは、米国の複数の医療機関の共同作業である。
データはhttps://github.com/zl-liu/Radiation-Oncology-NLP-Databaseで公開されている。
関連論文リスト
- An Introduction to Natural Language Processing Techniques and Framework
for Clinical Implementation in Radiation Oncology [1.2714439146420664]
放射線オンコロジー研究において,大規模言語モデル(LLM)を用いた最先端NLPアプリケーションを提案する。
LLMは、厳格な評価と検証を必要とする幻覚、偏見、倫理的違反など、多くの誤りを起こしやすい。
本論は, 臨床放射線腫瘍学におけるNLPモデルの開発と利用に関心がある研究者や臨床医に対して, 指導と洞察を提供することを目的とする。
論文 参考訳(メタデータ) (2023-11-03T19:32:35Z) - LLM-driven Multimodal Target Volume Contouring in Radiation Oncology [55.20049911531224]
大規模言語モデル(LLM)は、テキスト情報と画像の統合を容易にする。
LLM駆動型マルチモーダルAIを,放射線治療における目標音量調整の課題に適用する。
提案モデルでは,従来の視覚のみのAIモデルと比較して,性能が著しく向上していることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:38:42Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - RadOnc-GPT: A Large Language Model for Radiation Oncology [42.92077650252404]
RadOnc-GPTは、アリゾナ州のマヨクリニックの放射線腫瘍学患者の大規模なデータセットに基づいて微調整された。
このモデルは、放射線治療レギュレータの生成、最適な放射線モダリティの決定、診断記述/ICDコードの提供という、3つの重要なタスクを指導チューニングする。
論文 参考訳(メタデータ) (2023-09-18T21:15:02Z) - Radiology-Llama2: Best-in-Class Large Language Model for Radiology [71.27700230067168]
本稿では,ラジオロジーに特化した大規模言語モデルであるRadiology-Llama2を紹介する。
MIMIC-CXRとOpenIデータセットのROUGEメトリクスを用いた定量的評価は、Radiology-Llama2が最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2023-08-29T17:44:28Z) - Radiology-GPT: A Large Language Model for Radiology [45.00809146416551]
本稿では,ラジオロジーのための大規模言語モデルであるRadiology-GPTを紹介する。
StableLM、Dolly、LLaMAといった一般的な言語モデルと比較して、優れたパフォーマンスを示している。
放射線診断、研究、通信において大きな汎用性を示す。
論文 参考訳(メタデータ) (2023-06-14T17:57:24Z) - White Matter Tracts are Point Clouds: Neuropsychological Score
Prediction and Critical Region Localization via Geometric Deep Learning [68.5548609642999]
ホワイトマタートラクトデータを用いた神経心理学的スコア予測のためのディープラーニングに基づくフレームワークを提案する。
各点の微細構造測定を行う点雲として, arcuate fasciculus (AF) を表現した。
Paired-Siamese Lossでは,連続した神経心理学的スコアの違いに関する情報を利用した予測性能を改善した。
論文 参考訳(メタデータ) (2022-07-06T02:03:28Z) - Exploring and Distilling Posterior and Prior Knowledge for Radiology
Report Generation [55.00308939833555]
PPKEDには、Posterior Knowledge Explorer (PoKE), Prior Knowledge Explorer (PrKE), Multi-domain Knowledge Distiller (MKD)の3つのモジュールが含まれている。
PoKEは後部知識を探求し、視覚データのバイアスを軽減するために明確な異常な視覚領域を提供する。
PrKEは、以前の医学知識グラフ(医学知識)と以前の放射線学レポート(作業経験)から以前の知識を探り、テキストデータのバイアスを軽減する。
論文 参考訳(メタデータ) (2021-06-13T11:10:02Z) - A Systematic Review of Natural Language Processing Applied to Radiology
Reports [3.600747505433814]
本研究は, 放射線学報告に応用されたNLPの最近の文献を体系的に評価する。
本研究は, 放射線学的特徴, nlp法, 性能, 研究, 臨床応用特性を含む21の変数に基づく。
論文 参考訳(メタデータ) (2021-02-18T18:54:41Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - A Natural Language Processing Pipeline of Chinese Free-text Radiology
Reports for Liver Cancer Diagnosis [8.549162626766332]
本研究は,中国の放射線医学報告から臨床関連特徴を直接抽出するためのNLPパイプラインを設計した。
パイプラインは、名前付きエンティティ認識、同義語正規化、関係抽出から構成されていた。
肝癌診断では,無作為林が肝癌診断において最高の成績を示した。
論文 参考訳(メタデータ) (2020-04-10T09:32:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。