論文の概要: Leveraging wisdom of the crowds to improve consensus among radiologists
by real time, blinded collaborations on a digital swarm platform
- arxiv url: http://arxiv.org/abs/2107.07341v1
- Date: Sat, 26 Jun 2021 06:52:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-18 19:34:54.401959
- Title: Leveraging wisdom of the crowds to improve consensus among radiologists
by real time, blinded collaborations on a digital swarm platform
- Title(参考訳): 群衆の知恵を活用して放射線科医のコンセンサスをリアルタイムで改善し、デジタルスウォームプラットフォーム上でのブラインドされたコラボレーション
- Authors: Rutwik Shah, Bruno Astuto, Tyler Gleason, Will Fletcher, Justin
Banaga, Kevin Sweetwood, Allen Ye, Rina Patel, Kevin McGill, Thomas Link,
Jason Crane, Valentina Pedoia, Sharmila Majumdar
- Abstract要約: 低読影信頼性(IRR)は、難しいケースを解釈する際に専門家の間で見られる。
我々はミツバチの生物群をモデルとした溶液を探索した。
スウォームの賛成票は、放射線学者と住民コホートの両方で個人と過半数の票決を上回った。
- 参考スコア(独自算出の注目度): 0.18593647992779516
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Radiologists today play a key role in making diagnostic decisions and
labeling images for training A.I. algorithms. Low inter-reader reliability
(IRR) can be seen between experts when interpreting challenging cases. While
teams-based decisions are known to outperform individual decisions,
inter-personal biases often creep up in group interactions which limit
non-dominant participants from expressing true opinions. To overcome the dual
problems of low consensus and inter-personal bias, we explored a solution
modeled on biological swarms of bees. Two separate cohorts; three radiologists
and five radiology residents collaborated on a digital swarm platform in real
time and in a blinded fashion, grading meniscal lesions on knee MR exams. These
consensus votes were benchmarked against clinical (arthroscopy) and
radiological (senior-most radiologist) observations. The IRR of the consensus
votes was compared to the IRR of the majority and most confident votes of the
two cohorts.The radiologist cohort saw an improvement of 23% in IRR of swarm
votes over majority vote. Similar improvement of 23% in IRR in 3-resident swarm
votes over majority vote, was observed. The 5-resident swarm had an even higher
improvement of 32% in IRR over majority vote. Swarm consensus votes also
improved specificity by up to 50%. The swarm consensus votes outperformed
individual and majority vote decisions in both the radiologists and resident
cohorts. The 5-resident swarm had higher IRR than 3-resident swarm indicating
positive effect of increased swarm size. The attending and resident swarms also
outperformed predictions from a state-of-the-art A.I. algorithm. Utilizing a
digital swarm platform improved agreement and allows participants to express
judgement free intent, resulting in superior clinical performance and robust
A.I. training labels.
- Abstract(参考訳): 今日、放射線科医は診断決定や画像のラベル付けにおいて重要な役割を担っている。
アルゴリズム。
低読影信頼性(IRR)は、難しいケースを解釈する際に専門家の間で見られる。
チームベースの決定は個々の決定を上回ることは知られているが、個人間のバイアスは、非支配的な参加者が真の意見を述べることを制限するグループ間インタラクションにおいて、しばしば潜んでいる。
低コンセンサスと対人偏見という2つの問題を克服するため,ハチの生物群をモデルとしたソリューションを探索した。
3人の放射線科医と5人の放射線科医がリアルタイムで、目隠しで、膝関節MRI検査で半月板病変を悪化させ、デジタルスワムプラットフォームで協力した。
これらの意見投票は、臨床(関節鏡)と放射線学(老年者)の観察と比較された。
コンセンサス投票のirrは、多数派のirrと2人のコーホートの最も自信のある投票と比較され、放射線科医のcohortは、多数派投票よりスウォーム投票のirrが23%向上した。
多数決に対する3回投票におけるirrの23%の同様の改善が観察された。
5選挙区のスウォームは、過半数の票よりも32%高い改善率を示した。
swarmコンセンサス投票は、仕様を最大50%改善した。
スウォームコンセンサス投票は、放射線科医と住民のコホートの両方で個人と過半数の投票決定を上回った。
5-resident swarmは3-resident swarmよりもIRRが高かった。
参加者や住民の群れも、最先端のAIからの予測を上回った。
アルゴリズム。
デジタルスワーミングプラットフォームによる合意の改善と、参加者の判断の自由意思の表現を可能にし、優れた臨床パフォーマンスと堅牢なaiを実現する。
トレーニングラベル。
関連論文リスト
- Enhancing Trust in Clinically Significant Prostate Cancer Prediction with Multiple Magnetic Resonance Imaging Modalities [61.36288157482697]
米国では、前立腺がんが男性の死因としては2番目に多く、2024年には35,250人が死亡している。
本稿では,複数のMRIモダリティを組み合わせて深層学習モデルを訓練し,臨床的に有意な前立腺癌予測のためのモデルの信頼性を高めることを検討する。
論文 参考訳(メタデータ) (2024-11-07T12:48:27Z) - Rene: A Pre-trained Multi-modal Architecture for Auscultation of Respiratory Diseases [5.810320353233697]
本稿では,呼吸音の認識に適した大規模モデルであるReneを紹介する。
我々の革新的なアプローチは、事前訓練された音声認識モデルを用いて呼吸音を処理している。
我々は,Reneアーキテクチャを用いた実時間呼吸音識別システムを開発した。
論文 参考訳(メタデータ) (2024-05-13T03:00:28Z) - RadOnc-GPT: A Large Language Model for Radiation Oncology [42.92077650252404]
RadOnc-GPTは、アリゾナ州のマヨクリニックの放射線腫瘍学患者の大規模なデータセットに基づいて微調整された。
このモデルは、放射線治療レギュレータの生成、最適な放射線モダリティの決定、診断記述/ICDコードの提供という、3つの重要なタスクを指導チューニングする。
論文 参考訳(メタデータ) (2023-09-18T21:15:02Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z) - Act Like a Radiologist: Radiology Report Generation across Anatomical Regions [50.13206214694885]
X-RGenは6つの解剖学的領域にわたる放射線学者によるレポート生成フレームワークである。
X-RGenでは、ヒトの放射線学者の行動を模倣し、これらを4つの主要な段階に分解する。
画像エンコーダの認識能力は,各領域にまたがる画像やレポートを分析して向上する。
論文 参考訳(メタデータ) (2023-05-26T07:12:35Z) - Moving from 2D to 3D: volumetric medical image classification for rectal
cancer staging [62.346649719614]
術前T2期とT3期を区別することは直腸癌治療における最も困難かつ臨床的に重要な課題である。
直腸MRIでT3期直腸癌からT2を正確に判別するための体積畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-13T07:10:14Z) - SCALP -- Supervised Contrastive Learning for Cardiopulmonary Disease
Classification and Localization in Chest X-rays using Patient Metadata [10.269187107011934]
そこで我々は,自己監督型コントラストアプローチを教師付き設定に拡張する,エンドツーエンドフレームワークであるSCALPを紹介した。
SCALPは同一患者(陽性キー)から胸部X線を抽出し、異なる患者(陰キー)から胸部X線を分離する
実験により,SCALPは,分類タスクと局所化タスクの両方において,有意な差で既存のベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2021-10-27T21:38:12Z) - Multiple Sclerosis Lesions Identification/Segmentation in Magnetic
Resonance Imaging using Ensemble CNN and Uncertainty Classification [7.260554897161948]
3つの重要な概念に基づくMS病変の同定・分類のための自動フレームワークを提案する。
提案されたフレームワークは、2016年のMSSEGベンチマーク公開データセットでトレーニング、検証、テストされている。
結果も不確実性を示すが、他のレーダとの比較は不可能である。
論文 参考訳(メタデータ) (2021-08-26T13:48:06Z) - Fully-Automated Liver Tumor Localization and Characterization from
Multi-Phase MR Volumes Using Key-Slice ROI Parsing: A Physician-Inspired
Approach [24.39183542768238]
肝腫瘍の診断には放射線検査が不可欠である。
トップの放射線科医は、適度なレート間合意だけで約80%のf1スコアしか達成できない。
重要な課題は、診断可能な関心領域をローカライズするために、3次元MRボリュームを堅牢に解析することである。
論文 参考訳(メタデータ) (2020-12-13T05:23:33Z) - COMPOSE: Cross-Modal Pseudo-Siamese Network for Patient Trial Matching [70.08786840301435]
本稿では, CrOss-Modal PseudO-SiamEse Network (COMPOSE) を提案する。
実験の結果,患者基準マッチングでは98.0%,患者基準マッチングでは83.7%の精度でAUCに到達できることがわかった。
論文 参考訳(メタデータ) (2020-06-15T21:01:33Z) - A Global Benchmark of Algorithms for Segmenting Late Gadolinium-Enhanced
Cardiac Magnetic Resonance Imaging [90.29017019187282]
現在世界最大の心臓LGE-MRIデータセットである154個の3D LGE-MRIを用いた「2018 left Atrium Challenge」。
技術および生物学的指標を用いた提案アルゴリズムの解析を行った。
その結果, 最上部法は93.2%, 平均表面は0.7mmであった。
論文 参考訳(メタデータ) (2020-04-26T08:49:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。