論文の概要: Technical specification of a framework for the collection of clinical images and data
- arxiv url: http://arxiv.org/abs/2508.03723v1
- Date: Tue, 29 Jul 2025 17:30:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.327224
- Title: Technical specification of a framework for the collection of clinical images and data
- Title(参考訳): 臨床画像とデータの収集のためのフレームワークの技術的仕様
- Authors: Alistair Mackenzie, Mark Halling-Brown, Ruben van Engen, Carlijn Roozemond, Lucy Warren, Dominic Ward, Nadia Smith,
- Abstract要約: ここで説明したメインコレクションフレームワークの主な特徴は、自動化され、進行中のデータセットのコレクションを可能にすることである。
データセットには、長期間のフォローアップを伴う古いケースが混在していることが重要です。
完全に自動化されたアプローチに従わない他のタイプのコレクションフレームワークについても述べられている。
- 参考スコア(独自算出の注目度): 0.10051474951635875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this report a framework for the collection of clinical images and data for use when training and validating artificial intelligence (AI) tools is described. The report contains not only information about the collection of the images and clinical data, but the ethics and information governance processes to consider ensuring the data is collected safely, and the infrastructure and agreements required to allow for the sharing of data with other groups. A key characteristic of the main collection framework described here is that it can enable automated and ongoing collection of datasets to ensure that the data is up-to-date and representative of current practice. This is important in the context of training and validating AI tools as it is vital that datasets have a mix of older cases with long term follow-up such that the clinical outcome is as accurate as possible, and current data. Validations run on old data will provide findings and conclusions relative to the status of the imaging units when that data was generated. It is important that a validation dataset can assess the AI tools with data that it would see if deployed and active now. Other types of collection frameworks, which do not follow a fully automated approach, are also described. Whilst the fully automated method is recommended for large scale, long-term image collection, there may be reasons to start data collection using semi-automated methods and indications of how to do that are provided.
- Abstract(参考訳): 本稿では,人工知能(AI)ツールのトレーニングおよび検証に使用する臨床画像とデータの収集のためのフレームワークについて述べる。
本報告は、画像や臨床データの収集に関する情報だけでなく、データを安全に収集することを検討する倫理や情報ガバナンスのプロセスや、他グループとのデータの共有を可能にするために必要なインフラや合意も含んでいる。
ここで説明したメインコレクションフレームワークのキーとなる特徴は、データセットの自動化と進行中の収集を可能にし、データが最新で現在のプラクティスを表していることを保証することである。
これは、AIツールのトレーニングと検証の文脈において重要である。データセットには、臨床結果が可能な限り正確であるように、長期間のフォローアップを伴う古いケースと、現在のデータとが混在していることが不可欠である。
古いデータ上で実行される検証は、そのデータが生成されたときの撮像ユニットの状態に対する結果と結論を提供する。
バリデーションデータセットがAIツールを、現在デプロイおよびアクティブであるかどうかを確認するデータで評価できることが重要です。
完全に自動化されたアプローチに従わない他のタイプのコレクションフレームワークについても述べられている。
大規模な長期画像収集には完全自動化法が推奨されるが,半自動化法を用いてデータ収集を開始する理由と,それを行う方法を示す指標が考えられる。
関連論文リスト
- Agentic AI framework for End-to-End Medical Data Inference [5.871161259593687]
我々は、摂取から推論まで、臨床データパイプライン全体を自動化するエージェントAIフレームワークを導入する。
本システムは, 高齢者, 緩和ケア, 大腸内視鏡検査から入手可能なデータセットを用いて評価した。
論文 参考訳(メタデータ) (2025-07-24T05:56:25Z) - An Ensemble Scheme for Proactive Dominant Data Migration of Pervasive Tasks at the Edge [5.4327243200369555]
本稿では,インフラ内の特定の場所に移動すべき適切なデータの識別について,自律エッジノードで実装する手法を提案する。
我々の目標は、オフロードされたデータ駆動タスクに関連するアクセスパターンを理解できるようにノードに装備することである。
これらのタスクは、元のホスティングノードにないデータの処理に依存することは明らかである。
これらのデータ間隔を推定するために,統計的指向モデルと機械学習フレームワークを統合したアンサンブルアプローチを用いる。
論文 参考訳(メタデータ) (2024-10-12T19:09:16Z) - HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models [16.567468717846676]
HoneyBeeは、マルチモーダルオンコロジーデータセットを構築するためのスケーラブルなモジュラーフレームワークである。
生の医療データに欠かせない特徴や関係を捉えた埋め込みを生成する。
HoneyBeeは、現在進行中のオープンソース活動であり、コード、データセット、モデルは、プロジェクトリポジトリで利用可能である。
論文 参考訳(メタデータ) (2024-05-13T04:35:14Z) - An Integrated Data Processing Framework for Pretraining Foundation Models [57.47845148721817]
研究者や実践者は、しばしば異なるソースからデータセットを手動でキュレートする必要がある。
本稿では,処理モジュールと解析モジュールを統合したデータ処理フレームワークを提案する。
提案されたフレームワークは使いやすく、柔軟です。
論文 参考訳(メタデータ) (2024-02-26T07:22:51Z) - Collect, Measure, Repeat: Reliability Factors for Responsible AI Data
Collection [8.12993269922936]
AIのデータ収集は責任ある方法で行うべきだと我々は主張する。
本稿では,データ収集をメトリクスの集合でガイドするResponsible AI(RAI)手法を提案する。
論文 参考訳(メタデータ) (2023-08-22T18:01:27Z) - Surgical Phase and Instrument Recognition: How to identify appropriate
Dataset Splits [2.045596350476764]
この作業は、データセット分割のインタラクティブな探索を可能にする、公開データ可視化ツールを提供する。
位相、位相遷移、楽器、計器の組み合わせの発生を可視化することに焦点を当てている。
結果: 一般的なColec80データセット分割の解析を行い, いずれかの集合に表現されていない相転移と組み合わせを明らかにすることができた。
論文 参考訳(メタデータ) (2023-06-29T12:02:16Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Benchmark datasets driving artificial intelligence development fail to
capture the needs of medical professionals [4.799783526620609]
臨床およびバイオメディカル自然言語処理(NLP)の幅広い領域に関するデータセットとベンチマークのカタログを公開した。
450のNLPデータセットが手動で体系化され、豊富なメタデータで注釈付けされた。
我々の分析は、AIベンチマークの直接臨床関連性は乏しく、臨床医が対応したい仕事のほとんどをカバーできないことを示唆している。
論文 参考訳(メタデータ) (2022-01-18T15:05:28Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。