論文の概要: VIDS: A Verified Imaging Dataset Standard for Medical AI
- arxiv url: http://arxiv.org/abs/2604.17525v1
- Date: Sun, 19 Apr 2026 16:36:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.570083
- Title: VIDS: A Verified Imaging Dataset Standard for Medical AI
- Title(参考訳): VIDS: 医療AIのための検証済みイメージングデータセット標準
- Authors: Joan S. Muthu, John Shalen,
- Abstract要約: 既存の標準では、データセット構造、アノテーションの証明、品質ドキュメント、MLの準備にマシンで強化可能なバリデーションを提供していません。
本稿では、フォルダレイアウト、ファイルの命名、アノテーション証明スキーマ、品質文書、および2つのコンプライアンスプロファイルにわたる21のマシン強化検証ルールを定義するオープン仕様であるVIDSを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical imaging AI development is fundamentally dependent on annotated datasets, yet no existing standard provides machine-enforceable validation across dataset structure, annotation provenance, quality documentation, and ML readiness within a single framework. DICOM standardizes image acquisition, storage, and communication at the individual study level. BIDS organizes neuroimaging research datasets with consistent naming conventions. Neither addresses the curation layer, viz., who annotated what, when, with what tool, and to what quality standard. This paper presents VIDS (Verified Imaging Dataset Standard), an open specification that defines folder layout, file naming, annotation provenance schemas, quality documentation, and 21 machine-enforceable validation rules across two compliance profiles. VIDS uses NIfTI as a canonical working format while preserving full DICOM metadata in sidecars for traceability, and supports export to any downstream ML framework (nnU-Net, MONAI, COCO, flat NIfTI) without loss of provenance. Twenty-two compliance dimensions are defined and four major public datasets -- LIDC-IDRI, BraTS, CheXpert, and the Medical Segmentation Decathlon -- are benchmarked against these dimensions. Even widely used datasets satisfy only 20--39% of these dimensions, with provenance and quality documentation as the largest systematic gaps. LIDC-Hybrid-100 is released as a 100-subject VIDS-compliant reference CT dataset with consensus segmentation masks from four radiologist annotations (mean pairwise Dice 0.7765), validating 21/21 on the Full compliance profile. VIDS is fully open source: the specification is CC BY 4.0, all tools are Apache 2.0, the reference validator is available on PyPI (pip install vids-validator), and LIDC-Hybrid-100 is published on Zenodo (https://doi.org/10.5281/zenodo.19582717).
- Abstract(参考訳): 医用画像AIの開発は、基本的にアノテーション付きデータセットに依存しているが、既存の標準では、データセット構造、アノテーションの証明、品質ドキュメント、単一のフレームワーク内でのMLの準備にマシン強化可能なバリデーションを提供していない。
DICOMは、個々の研究レベルで画像の取得、保存、通信を標準化する。
BIDSは、一貫した命名規則で神経画像研究データセットを編成する。
どちらもキュレーションレイヤであるviz.に対処せず、どのツールで、いつ、どのツールで、どの品質基準でアノテートするのか。
本稿では、フォルダレイアウト、ファイル名、アノテーション前処理スキーマ、品質文書、および2つのコンプライアンスプロファイルにわたる21のマシン強化検証ルールを定義するオープン仕様であるVIDS(Verified Imaging Dataset Standard)を提案する。
VIDSは、標準的な作業フォーマットとしてNIfTIを使用し、トレーサビリティのためにサイドカーに完全なDICOMメタデータを保持し、実績を失うことなく、ダウンストリームMLフレームワーク(nnU-Net、MONAI、COCO、フラットNIfTI)へのエクスポートをサポートする。
20のコンプライアンスディメンションが定義され、LIDC-IDRI、BraTS、CheXpert、Messical Segmentation Decathlonの4つの主要な公開データセットがこれらのディメンションに対してベンチマークされている。広く使用されているデータセットでさえ、これらのディメンションの20~39%しか満たされておらず、証明と品質ドキュメントが最大のシステマティックギャップとなっている。
LIDC-Hybrid-100は、100サブジェクトのVIDS準拠の参照CTデータセットとしてリリースされ、4つのラジオロジストアノテーション(ペアワイドDice 0.7765)のコンセンサスセグメンテーションマスクを持ち、フルコンプライアンスプロファイルで21/21を検証する。
VIDSは完全にオープンソースで、仕様はCC BY 4.0、すべてのツールはApache 2.0、参照バリデータはPyPI(pip install vids-validator)、LIDC-Hybrid-100はZenodo(https://doi.org/10.5281/zenodo. 19582717)で公開されている。
関連論文リスト
- MetaDent: Labeling Clinical Images for Vision-Language Models in Dentistry [32.93319761809706]
VLM(Vision-Language Models)は、医用画像解析において重要な可能性を示している。
口内撮影におけるそれらの応用は、細粒度で注釈付きデータセットと包括的なベンチマークが欠如していることから、いまだほとんど探索されていない。
本稿では, 臨床, 公衆およびWebソースから収集した, 新規で大規模な歯科画像データセットを含む包括的リソースであるMetaDentについて紹介する。
論文 参考訳(メタデータ) (2026-04-16T10:56:54Z) - DocDjinn: Controllable Synthetic Document Generation with VLMs and Handwriting Diffusion [5.342168661302001]
視覚言語モデル(VLM)を用いた制御可能な合成文書生成のための新しいフレームワークを提案する。
提案手法は,既存のソースデータセットの分布に従う視覚的かつ意味論的に一貫した合成文書を生成する。
我々のフレームワークは、実世界のデータセット全体のパフォーマンスに対して平均87%の価格で達成されていることを示す。
論文 参考訳(メタデータ) (2026-02-25T11:52:13Z) - A Large Scale Empirical Analysis on the Adherence Gap between Standards and Tools in SBOM [54.38424417079265]
ソフトウェア・ビル・オブ・マテリアル(Software Bill of Materials, SBOM)は、ソフトウェア情報を整理する機械読み取り可能なアーティファクトである。
標準に従って、組織はSBOMの生成と利用のためのツールを開発した。
本稿では,我々の自動評価フレームワークであるSAPを用いて,接着ギャップの大規模2段階解析を行った。
論文 参考訳(メタデータ) (2026-01-09T08:26:05Z) - DOCR-Inspector: Fine-Grained and Automated Evaluation of Document Parsing with VLM [35.910677096654574]
文書解析は、構造化されていないPDF画像を半構造化データに変換することを目的としており、多様な領域における情報のデジタル化と活用を容易にする。
一般的なプラクティスは、しばしば標準ベンチマークで最高のパフォーマンスモデルを選択する。
本稿では,文書解析評価をきめ細かな誤り検出と解析として形式化するDOCR-Inspectorを紹介する。
論文 参考訳(メタデータ) (2025-12-11T13:16:33Z) - MonkeyOCR v1.5 Technical Report: Unlocking Robust Document Parsing for Complex Patterns [80.05126590825121]
MonkeyOCR v1.5は、レイアウト理解とコンテンツ認識の両方を強化する統合ビジョン言語フレームワークである。
複雑なテーブル構造に対処するために,視覚的整合性に基づく強化学習手法を提案する。
2つの特別なモジュール、Image-Decoupled Table ParsingとType-Guided Table Mergingを導入し、テーブルの信頼性の高いパースを可能にする。
論文 参考訳(メタデータ) (2025-11-13T15:12:17Z) - Medical Image De-Identification Resources: Synthetic DICOM Data and Tools for Validation [0.10617782943195009]
患者のプライバシーを確保することは、オープンアクセスデータ共有にとって重要な課題である。
Digital Imaging and Communications in Medicine (DICOM)は、重要な臨床メタデータと広範囲に保護された健康情報(PHI)と個人識別可能な情報の両方を符号化する(PII)。
このギャップに対処するために、合成PHI/PIIを取り入れたオープンアクセス型DICOMデータセットと、画像識別のベンチマークを行うための評価フレームワークを開発した。
論文 参考訳(メタデータ) (2025-08-03T18:48:28Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [68.18620488664187]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、密度分布を持つ。
各種ラベル付き環境下での多目的対象物に対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Extending the WILDS Benchmark for Unsupervised Adaptation [186.90399201508953]
We present the WILDS 2.0 update, which extends 8 of the 10 datasets in the WILDS benchmark of distribution shifts to include curated unlabeled data。
これらのデータセットは、組織学から野生生物保護まで幅広い応用、タスク(分類、回帰、検出)、モダリティにまたがる。
ドメイン不変量や自己学習,自己管理など,ラベルのないデータを活用する最先端の手法を体系的にベンチマークする。
論文 参考訳(メタデータ) (2021-12-09T18:32:38Z) - The Problem of Zombie Datasets:A Framework For Deprecating Datasets [55.878249096379804]
我々は、ImageNet、8000 Million Tiny Images、MS-Celeb-1M、Duke MTMC、Brainwash、HRT Transgenderなど、いくつかの著名なデータセットの公開後処理について検討する。
本稿では,リスクの考慮,影響の緩和,アピール機構,タイムライン,非推奨プロトコル,公開チェックなどを含むデータセットの非推奨化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-18T20:13:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。