論文の概要: The Radiation Oncology NLP Database
- arxiv url: http://arxiv.org/abs/2401.10995v1
- Date: Fri, 19 Jan 2024 19:23:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 18:29:04.389804
- Title: The Radiation Oncology NLP Database
- Title(参考訳): 放射線腫瘍学nlpデータベース
- Authors: Zhengliang Liu, Jason Holmes, Wenxiong Liao, Chenbin Liu, Lian Zhang,
Hongying Feng, Peilong Wang, Muhammad Ali Elahi, Hongmin Cai, Lichao Sun,
Quanzheng Li, Xiang Li, Tianming Liu, Jiajian Shen, Wei Liu
- Abstract要約: 放射線オンコロジーのためのNLPデータセットとして,放射線オンコロジーNLPデータベース(ROND)を提案する。
RONDは放射線腫瘍学の領域におけるこのギャップに対処するために特別に設計された。
Logic Reasoning, Text Classification, Named Entity Recognition (NER), Question Answering (QA), Text Summarization, patient-Clinician Conversationsなど,さまざまなNLPタスクを含んでいる。
- 参考スコア(独自算出の注目度): 33.391114383354804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Radiation Oncology NLP Database (ROND), the first dedicated
Natural Language Processing (NLP) dataset for radiation oncology, an important
medical specialty that has received limited attention from the NLP community in
the past. With the advent of Artificial General Intelligence (AGI), there is an
increasing need for specialized datasets and benchmarks to facilitate research
and development. ROND is specifically designed to address this gap in the
domain of radiation oncology, a field that offers many opportunities for NLP
exploration. It encompasses various NLP tasks including Logic Reasoning, Text
Classification, Named Entity Recognition (NER), Question Answering (QA), Text
Summarization, and Patient-Clinician Conversations, each with a distinct focus
on radiation oncology concepts and application cases. In addition, we have
developed an instruction-tuning dataset consisting of over 20k instruction
pairs (based on ROND) and trained a large language model, CancerChat. This
serves to demonstrate the potential of instruction-tuning large language models
within a highly-specialized medical domain. The evaluation results in this
study could serve as baseline results for future research. ROND aims to
stimulate advancements in radiation oncology and clinical NLP by offering a
platform for testing and improving algorithms and models in a domain-specific
context. The ROND dataset is a joint effort of multiple U.S. health
institutions. The data is available at
https://github.com/zl-liu/Radiation-Oncology-NLP-Database.
- Abstract(参考訳): 本稿では,放射線腫瘍学のための最初の専用自然言語処理(nlp)データセットである放射線腫瘍学nlpデータベース(rond)について述べる。
agi(artificial general intelligence)の出現により、研究と開発を促進するために特別なデータセットとベンチマークの必要性が高まっている。
RONDは、NLP探査の多くの機会を提供する分野である放射線腫瘍学の領域において、このギャップに対処するために特別に設計された。
Logic Reasoning, Text Classification, Named Entity Recognition (NER), Question Answering (QA), Text Summarization, patient-Clinician Conversationsなど,さまざまなNLPタスクが含まれており,それぞれが放射線オンコロジーの概念や応用事例に重点を置いている。
さらに20万以上の命令ペア(rondに基づく)からなる命令チューニングデータセットを開発し,大規模な言語モデルである cancerchat をトレーニングした。
これは、高度に専門化された医療領域内で、大きな言語モデルを命令チューニングする可能性を示すのに役立つ。
本研究の評価結果は,今後の研究のベースラインとなるかもしれない。
RONDは、放射線腫瘍学と臨床NLPの進歩を促進すべく、ドメイン固有のコンテキストにおけるアルゴリズムとモデルのテストと改善のためのプラットフォームを提供する。
RONDデータセットは、米国の複数の医療機関の共同作業である。
データはhttps://github.com/zl-liu/Radiation-Oncology-NLP-Databaseで公開されている。
関連論文リスト
- Diagnostic Reasoning in Natural Language: Computational Model and Application [68.47402386668846]
言語基底タスク(NL-DAR)の文脈における診断誘導推論(DAR)について検討する。
パール構造因果モデルに基づくNL-DARの新しいモデリングフレームワークを提案する。
得られたデータセットを用いて,NL-DARにおける人間の意思決定過程を解析する。
論文 参考訳(メタデータ) (2024-09-09T06:55:37Z) - An Introduction to Natural Language Processing Techniques and Framework
for Clinical Implementation in Radiation Oncology [1.2714439146420664]
放射線オンコロジー研究において,大規模言語モデル(LLM)を用いた最先端NLPアプリケーションを提案する。
LLMは、厳格な評価と検証を必要とする幻覚、偏見、倫理的違反など、多くの誤りを起こしやすい。
本論は, 臨床放射線腫瘍学におけるNLPモデルの開発と利用に関心がある研究者や臨床医に対して, 指導と洞察を提供することを目的とする。
論文 参考訳(メタデータ) (2023-11-03T19:32:35Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - RadOnc-GPT: A Large Language Model for Radiation Oncology [42.92077650252404]
RadOnc-GPTは、アリゾナ州のマヨクリニックの放射線腫瘍学患者の大規模なデータセットに基づいて微調整された。
このモデルは、放射線治療レギュレータの生成、最適な放射線モダリティの決定、診断記述/ICDコードの提供という、3つの重要なタスクを指導チューニングする。
論文 参考訳(メタデータ) (2023-09-18T21:15:02Z) - Radiology-Llama2: Best-in-Class Large Language Model for Radiology [71.27700230067168]
本稿では,ラジオロジーに特化した大規模言語モデルであるRadiology-Llama2を紹介する。
MIMIC-CXRとOpenIデータセットのROUGEメトリクスを用いた定量的評価は、Radiology-Llama2が最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2023-08-29T17:44:28Z) - Radiology-GPT: A Large Language Model for Radiology [74.07944784968372]
本稿では,ラジオロジーのための大規模言語モデルであるRadiology-GPTを紹介する。
StableLM、Dolly、LLaMAといった一般的な言語モデルと比較して、優れたパフォーマンスを示している。
放射線診断、研究、通信において大きな汎用性を示す。
論文 参考訳(メタデータ) (2023-06-14T17:57:24Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - Exploring and Distilling Posterior and Prior Knowledge for Radiology
Report Generation [55.00308939833555]
PPKEDには、Posterior Knowledge Explorer (PoKE), Prior Knowledge Explorer (PrKE), Multi-domain Knowledge Distiller (MKD)の3つのモジュールが含まれている。
PoKEは後部知識を探求し、視覚データのバイアスを軽減するために明確な異常な視覚領域を提供する。
PrKEは、以前の医学知識グラフ(医学知識)と以前の放射線学レポート(作業経験)から以前の知識を探り、テキストデータのバイアスを軽減する。
論文 参考訳(メタデータ) (2021-06-13T11:10:02Z) - A Systematic Review of Natural Language Processing Applied to Radiology
Reports [3.600747505433814]
本研究は, 放射線学報告に応用されたNLPの最近の文献を体系的に評価する。
本研究は, 放射線学的特徴, nlp法, 性能, 研究, 臨床応用特性を含む21の変数に基づく。
論文 参考訳(メタデータ) (2021-02-18T18:54:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。