論文の概要: CytoCrowd: A Multi-Annotator Benchmark Dataset for Cytology Image Analysis
- arxiv url: http://arxiv.org/abs/2602.06674v1
- Date: Fri, 06 Feb 2026 13:00:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.402293
- Title: CytoCrowd: A Multi-Annotator Benchmark Dataset for Cytology Image Analysis
- Title(参考訳): CytoCrowd: 細胞画像解析のためのマルチアノテーションベンチマークデータセット
- Authors: Yonghao Si, Xingyuan Zeng, Zhao Chen, Libin Zheng, Caleb Chen Cao, Lei Chen, Jian Yin,
- Abstract要約: 我々は、医療画像分析のための新しい公開ベンチマークであるCytoCrowdを紹介する。
データセットには446の高解像度イメージがあり、それぞれに2つの重要なコンポーネントがある。
オブジェクト検出や分類といった標準的なコンピュータビジョンタスクのベンチマークとして機能する。
- 参考スコア(独自算出の注目度): 12.681868051192334
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-quality annotated datasets are crucial for advancing machine learning in medical image analysis. However, a critical gap exists: most datasets either offer a single, clean ground truth, which hides real-world expert disagreement, or they provide multiple annotations without a separate gold standard for objective evaluation. To bridge this gap, we introduce CytoCrowd, a new public benchmark for cytology analysis. The dataset features 446 high-resolution images, each with two key components: (1) raw, conflicting annotations from four independent pathologists, and (2) a separate, high-quality gold-standard ground truth established by a senior expert. This dual structure makes CytoCrowd a versatile resource. It serves as a benchmark for standard computer vision tasks, such as object detection and classification, using the ground truth. Simultaneously, it provides a realistic testbed for evaluating annotation aggregation algorithms that must resolve expert disagreements. We provide comprehensive baseline results for both tasks. Our experiments demonstrate the challenges presented by CytoCrowd and establish its value as a resource for developing the next generation of models for medical image analysis.
- Abstract(参考訳): 高品質なアノテートデータセットは、医療画像解析における機械学習の進歩に不可欠である。
しかし、重要なギャップは存在する: ほとんどのデータセットは、現実の専門家の意見の相違を隠す単一の、クリーンな真実を提供するか、客観的評価のための別々のゴールド標準のない複数のアノテーションを提供する。
このギャップを埋めるために、細胞学解析のための新しい公開ベンチマークであるCytoCrowdを紹介します。
このデータセットは446枚の高解像度画像を特徴とし,(1)独立系病理医による生の矛盾したアノテーション,(2)専門医が確立した高品質の金標準的真実の2つの重要な構成要素を特徴としている。
この二重構造により、CytoCrowdは汎用的なリソースとなる。
これは、オブジェクト検出や分類などの標準的なコンピュータビジョンタスクのベンチマークとして、基底真理を用いて機能する。
同時に、専門家の不一致を解決する必要があるアノテーション集約アルゴリズムを評価するための現実的なテストベッドを提供する。
両タスクの総合的なベースライン結果を提供する。
実験では,CytoCrowdが提示した課題を実証し,次世代の医用画像解析モデルを開発するための資源としての価値を確立した。
関連論文リスト
- UniREditBench: A Unified Reasoning-based Image Editing Benchmark [52.54256348710893]
この研究は、推論に基づく画像編集評価のための統一ベンチマークUniREditBenchを提案する。
精巧にキュレートされた2,700個のサンプルからなり、8つの一次次元と18のサブ次元にわたる実世界シナリオとゲーム世界のシナリオをカバーしている。
このデータセットにBagelを微調整し、UniREdit-Bagelを開発した。
論文 参考訳(メタデータ) (2025-11-03T07:24:57Z) - On the Risk of Misleading Reports: Diagnosing Textual Biases in Multimodal Clinical AI [4.866086225040713]
本稿では,モデルが二項分類タスクにおける各モータリティに依存することを定量化するための摂動に基づくアプローチを提案する。
画像やテキストを反対のラベルと交換することで、モダリティ固有のバイアスを露呈する。
論文 参考訳(メタデータ) (2025-07-31T21:35:52Z) - Rethinking Whole-Body CT Image Interpretation: An Abnormality-Centric Approach [57.86418347491272]
全身に404例の異常所見を呈する包括的階層分類システムを提案する。
複数平面および全人体領域からの14.5K以上のCT画像を含むデータセットを寄贈し,19K以上の異常に対する接地アノテーションを念頭に提供した。
OminiAbnorm-CTは,テキストクエリに基づいて,多面的および全身的なCT画像に異常な所見を自動的に検出し,記述することができる。
論文 参考訳(メタデータ) (2025-06-03T17:57:34Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - Two Is Better Than One: Aligned Representation Pairs for Anomaly Detection [56.57122939745213]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型手法は, 異常に関する事前知識を用いて, トレーニング中に合成外れ値を生成することによって, それらの表現をうまく学習している。
この制限は、通常のサンプルにおける対称性に関する事前の知識を活用して、異なるコンテキストでデータを観測する、新しいアプローチであるCon$で対処する。
論文 参考訳(メタデータ) (2024-05-29T07:59:06Z) - Benchmarking Pretrained Vision Embeddings for Near- and Duplicate Detection in Medical Images [0.6827423171182154]
本稿では,2次元コンピュータビジョンの埋め込みを利用した近距離・重複3次元医用画像の同定手法を提案する。
公開されているメディカルデスロンデータセットに基づいて,実験的なベンチマークを生成する。
論文 参考訳(メタデータ) (2023-12-12T13:52:55Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。