論文の概要: CliniDigest: A Case Study in Large Language Model Based Large-Scale
Summarization of Clinical Trial Descriptions
- arxiv url: http://arxiv.org/abs/2307.14522v2
- Date: Mon, 31 Jul 2023 19:00:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 16:59:42.719481
- Title: CliniDigest: A Case Study in Large Language Model Based Large-Scale
Summarization of Clinical Trial Descriptions
- Title(参考訳): CliniDigest: 大規模言語モデルによる臨床試験記述の大規模要約の事例研究
- Authors: Renee D. White (1), Tristan Peng (1), Pann Sripitak (1), Alexander
Rosenberg Johansen (1), Michael Snyder (1) ((1) Stanford University)
- Abstract要約: 2022年には、毎日100件以上の臨床試験がCricerTrials.govに提出された。
CliniDigestは、私たちの知る限り、臨床試験のリアルタイム、真実、そして包括的な要約を提供するための最初のツールです。
それぞれのフィールドに対して、CliniDigestは$mu=153, igma=69$の要約を生成し、それぞれが$mu=54%, sigma=30%のソースを使用する。
- 参考スコア(独自算出の注目度): 58.720142291102135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A clinical trial is a study that evaluates new biomedical interventions. To
design new trials, researchers draw inspiration from those current and
completed. In 2022, there were on average more than 100 clinical trials
submitted to ClinicalTrials.gov every day, with each trial having a mean of
approximately 1500 words [1]. This makes it nearly impossible to keep up to
date. To mitigate this issue, we have created a batch clinical trial summarizer
called CliniDigest using GPT-3.5. CliniDigest is, to our knowledge, the first
tool able to provide real-time, truthful, and comprehensive summaries of
clinical trials. CliniDigest can reduce up to 85 clinical trial descriptions
(approximately 10,500 words) into a concise 200-word summary with references
and limited hallucinations. We have tested CliniDigest on its ability to
summarize 457 trials divided across 27 medical subdomains. For each field,
CliniDigest generates summaries of $\mu=153,\ \sigma=69 $ words, each of which
utilizes $\mu=54\%,\ \sigma=30\% $ of the sources. A more comprehensive
evaluation is planned and outlined in this paper.
- Abstract(参考訳): 臨床試験は、新しいバイオメディカル介入を評価する研究である。
新しい試行をデザインするために、研究者は現在のものからインスピレーションを得て完成する。
2022年には、毎日100以上の臨床試験が行われ、各臨床試験の平均は1500語[1]である。
このため、最新の状態を維持することはほぼ不可能である。
この問題を軽減するため,GPT-3.5を用いたクリニダイジェスト(CliniDigest)という試薬を作成した。
CliniDigestは、私たちの知る限り、臨床試験のリアルタイム、真実、そして包括的な要約を提供する最初のツールです。
CliniDigestは、85の臨床試験記述(約10,500語)を、参照と限定幻覚を伴う簡潔な200ワードの要約に還元することができる。
CliniDigestを27のサブドメインに分けて457の臨床試験をまとめた。
各フィールドに対して、clinidigestは$\mu=153,\ \sigma=69 $ワードの要約を生成し、それぞれ$\mu=54\%,\ \sigma=30\% $のソースを使用する。
より包括的な評価を計画し、本稿で概説する。
関連論文リスト
- Panacea: A foundation model for clinical trial search, summarization, design, and recruitment [29.099676641424384]
パナセアという臨床試験基盤モデルを提案する。
Panaceaは、トライアル検索、トライアル要約、トライアルデザイン、患者と臨床のマッチングなど、複数のタスクを扱うように設計されている。
793,279のトライアル文書と1,113,207のトライアル関連科学論文からなる、TrialAlignという大規模なデータセットも収集しました。
論文 参考訳(メタデータ) (2024-06-25T21:29:25Z) - Large Language Models in the Clinic: A Comprehensive Benchmark [63.21278434331952]
診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
まず、さまざまな臨床言語の生成、理解、推論タスクを含む11の既存のデータセットを収集します。
次に,現実の実践において複雑だが一般的である6つの新しいデータセットと臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文 参考訳(メタデータ) (2024-04-25T15:51:06Z) - TrialDura: Hierarchical Attention Transformer for Interpretable Clinical Trial Duration Prediction [19.084936647082632]
マルチモーダルデータを用いて臨床試験期間を推定する機械学習に基づくTrialDuraを提案する。
バイオメディカルコンテキストに特化されたBio-BERT埋め込みにエンコードして,より深く,より関連するセマンティック理解を提供する。
提案モデルでは, 平均絶対誤差(MAE)が1.04年, 根平均二乗誤差(RMSE)が1.39年であった。
論文 参考訳(メタデータ) (2024-04-20T02:12:59Z) - AutoTrial: Prompting Language Models for Clinical Trial Design [53.630479619856516]
本稿では,言語モデルを用いた臨床検査基準の設計を支援するAutoTrialという手法を提案する。
70K以上の臨床試験で、AutoTrialが高品質な基準テキストを生成することが確認された。
論文 参考訳(メタデータ) (2023-05-19T01:04:16Z) - Exploring Optimal Granularity for Extractive Summarization of
Unstructured Health Records: Analysis of the Largest Multi-Institutional
Archive of Health Records in Japan [25.195233641408233]
「処分要約」は要約の有望な応用の1つである。
要約が構造されていないソースからどのように生成されるべきかは、まだ不明である。
本研究は,要約における最適粒度を同定することを目的とした。
論文 参考訳(メタデータ) (2022-09-20T23:26:02Z) - Trial2Vec: Zero-Shot Clinical Trial Document Similarity Search using
Self-Supervision [42.859662256134584]
同様の臨床試験に注釈を付けずに自己監督を通じて学習するTrial2Vecを提案する。
臨床試験文書(タイトル、資格基準、対象疾患など)のメタ構造と臨床知識を活用して、コントラスト的なサンプルを自動生成する。
本手法は, 可視化により医療的に解釈可能な埋め込みを実現し, 試行錯誤における最良基準値に対して平均15%の精度向上が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:37:11Z) - ITTC @ TREC 2021 Clinical Trials Track [54.141379782822206]
本課題は、患者の入院ノートの要約を構成するトピックに有効な臨床試験を適合させる問題に焦点を当てる。
NLP手法を用いて試行とトピックの表現方法を探索し、共通の検索モデルを用いて各トピックに関連するトライアルのランク付けリストを生成する。
提案されたすべての実行の結果は、すべてのトピックの中央値よりもはるかに上回っていますが、改善の余地はたくさんあります。
論文 参考訳(メタデータ) (2022-02-16T04:56:47Z) - CREATe: Clinical Report Extraction and Annotation Technology [53.731999072534876]
臨床症例報告は、特定の臨床症例の特異な側面を記述した記述である。
これらのレポートを注釈付け、インデックス付け、あるいはキュレートするエンドツーエンドシステムを開発する試みはない。
本稿では,新たな計算資源プラットフォームを提案し,臨床事例レポートの内容の抽出,索引付け,照会を行う。
論文 参考訳(メタデータ) (2021-02-28T16:50:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。