論文の概要: The Smart Data Extractor, a Clinician Friendly Solution to Accelerate
and Improve the Data Collection During Clinical Trials
- arxiv url: http://arxiv.org/abs/2308.16537v1
- Date: Thu, 31 Aug 2023 08:28:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-01 15:24:20.541767
- Title: The Smart Data Extractor, a Clinician Friendly Solution to Accelerate
and Improve the Data Collection During Clinical Trials
- Title(参考訳): smart data extractorは、臨床試験中にデータ収集を加速し改善する、クリニカルフレンドリーなソリューション
- Authors: Sophie Quennelle (HeKA, UPCit\'e, CRC), Maxime Douillet (Imagine),
Lisa Friedlander (UPCit\'e), Olivia Boyer (UPCit\'e), Anita Burgun (HeKA,
UPCit\'e, CRC), Antoine Neuraz (HeKA, UPCit\'e, CRC), Nicolas Garcelon (HeKA,
UPCit\'e, Imagine)
- Abstract要約: 医学研究において、患者ファイルを閲覧する伝統的な方法では、バイアス、エラー、人的労働力、コストを誘導することが証明されている。
ノートを含むあらゆる種類のデータを抽出できる半自動システムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In medical research, the traditional way to collect data, i.e. browsing
patient files, has been proven to induce bias, errors, human labor and costs.
We propose a semi-automated system able to extract every type of data,
including notes. The Smart Data Extractor pre-populates clinic research forms
by following rules. We performed a cross-testing experiment to compare
semi-automated to manual data collection. 20 target items had to be collected
for 79 patients. The average time to complete one form was 6'81'' for manual
data collection and 3'22'' with the Smart Data Extractor. There were also more
mistakes during manual data collection (163 for the whole cohort) than with the
Smart Data Extractor (46 for the whole cohort). We present an easy to use,
understandable and agile solution to fill out clinical research forms. It
reduces human effort and provides higher quality data, avoiding data re-entry
and fatigue induced errors.
- Abstract(参考訳): 医学研究において、患者ファイルを閲覧する伝統的な方法では、バイアス、エラー、人的労働力、コストを誘導することが証明されている。
ノートを含むあらゆる種類のデータを抽出できる半自動システムを提案する。
スマートデータエクストラクタは、以下のルールで臨床研究フォームをプリポピュレートする。
半自動データ収集と手動データ収集を比較したクロステスト実験を行った。
対象患者79名を対象に20項目を収集しなければならなかった。
1つのフォームを完了する平均時間は、手動のデータ収集で6'81'、Smart Data Extractorで3'22'であった。
手動のデータ収集(コホート全体の163)の間にも、Smart Data Extractor(コホート全体の46)よりも多くの誤りがあった。
臨床研究フォームを埋めるために、使いやすく、理解しやすく、アジャイルなソリューションを提示します。
人的労力を削減し、データの再突入や疲労によるエラーを回避することにより、高品質なデータを提供する。
関連論文リスト
- TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [57.067409211231244]
本稿では,マルチモーダルデータ(例えば,薬物分子,疾患コード,テキスト,分類・数値的特徴)と臨床治験設計における8つの重要な予測課題をカバーするAIreadyデータセットを精巧にキュレートした。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Automatic Data Curation for Self-Supervised Learning: A Clustering-Based Approach [36.47860223750303]
自己教師付き事前学習のための高品質データセットの自動キュレーションの問題点を考察する。
これらの基準をすべて満たしたクラスタリングに基づく手法を提案する。
我々の方法は、大規模で多様なデータリポジトリ上で、$k$-meansの連続的かつ階層的なアプリケーションを含む。
論文 参考訳(メタデータ) (2024-05-24T14:58:51Z) - Synthetic Data from Diffusion Models Improve Drug Discovery Prediction [1.3686993145787065]
データあいまいさは、重要な研究課題に答えようとする研究者にとって、データのキュレーションを難しくする。
本稿では,リガンドおよび薬物動態データをエンドツーエンドに生成できる新しい拡散GNNモデルSyngandを提案する。
我々は,AqSolDB,LD50,hERGを中心とした下流回帰タスクにおいて,Syngand生成した合成目標データの有効性について,最初の有望な結果を示した。
論文 参考訳(メタデータ) (2024-05-06T19:09:37Z) - README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.432205523734707]
医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文 参考訳(メタデータ) (2023-12-24T23:01:00Z) - Towards Unifying Anatomy Segmentation: Automated Generation of a
Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines [113.08940153125616]
我々は533巻のボクセルレベルのラベルを142ドル(約1万2000円)で、全身CTスキャンのデータセットを作成し、解剖学的包括的カバレッジを提供する。
提案手法はラベル集約段階において手作業によるアノテーションに依存しない。
我々はCTデータに142ドルの解剖学的構造を予測できる統一解剖学的セグメンテーションモデルをリリースする。
論文 参考訳(メタデータ) (2023-07-25T09:48:13Z) - Machine Learning Force Fields with Data Cost Aware Training [94.78998399180519]
分子動力学(MD)シミュレーションを加速するために機械学習力場(MLFF)が提案されている。
最もデータ効率のよいMLFFであっても、化学精度に達するには数百フレームの力とエネルギーのラベルが必要になる。
我々は、安価な不正確なデータと高価な正確なデータの組み合わせを利用して、MLFFのデータコストを下げる多段階計算フレームワークASTEROIDを提案する。
論文 参考訳(メタデータ) (2023-06-05T04:34:54Z) - Time-dependent Iterative Imputation for Multivariate Longitudinal
Clinical Data [0.0]
Time-Dependent Iterative Imputationは時系列データを計算するための実用的なソリューションを提供する。
500,000人以上の患者を観察するコホートに応用した場合,本手法は最先端の計算法より優れていた。
論文 参考訳(メタデータ) (2023-04-16T16:10:49Z) - Optimizing Data Collection for Machine Learning [87.37252958806856]
現代のディープラーニングシステムは、素晴らしいパフォーマンスを達成するために巨大なデータセットを必要とします。
過度に収集したデータは不要な現在のコストを発生させる一方、過度に収集したデータは将来のコストと遅延を引き起こす可能性がある。
本稿では,データ収集を形式的最適データ収集問題としてモデル化するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2022-10-03T21:19:05Z) - Deep Learning and Handheld Augmented Reality Based System for Optimal
Data Collection in Fault Diagnostics Domain [0.0]
本稿では,最小限のデータを用いて故障診断を行う新しいヒューマン・マシン・インタラクション・フレームワークを提案する。
必要なデータの最小化は、障害の診断におけるデータ駆動モデルの実践可能性を高める。
提案するフレームワークは,各障害条件のインスタンスが1つしかない新しいデータセットに対して,100%以上の精度とリコールを提供する。
論文 参考訳(メタデータ) (2022-06-15T19:15:26Z) - Does BERT Pretrained on Clinical Notes Reveal Sensitive Data? [70.3631443249802]
我々は、トレーニングされたBERTからPersonal Health Informationを復元するためのアプローチのバッテリーを設計する。
具体的には,患者の名前と関連した状態の回復を試みている。
簡単な探索法では,MIMIC-IIIコーパス上で訓練されたBERTから機密情報を有意に抽出できないことがわかった。
論文 参考訳(メタデータ) (2021-04-15T20:40:05Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。