論文の概要: Data, Assemble: Leveraging Multiple Datasets with Heterogeneous and
Partial Labels
- arxiv url: http://arxiv.org/abs/2109.12265v1
- Date: Sat, 25 Sep 2021 02:48:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:56:20.968580
- Title: Data, Assemble: Leveraging Multiple Datasets with Heterogeneous and
Partial Labels
- Title(参考訳): データ,アセンブル:不均質なラベルと部分的なラベルを持つ複数のデータセットを活用する
- Authors: Mintong Kang, Yongyi Lu, Alan L. Yuille, Zongwei Zhou
- Abstract要約: は、データセットのアセンブリから部分的にラベル付けされたデータの完全な可能性を解き放つことを目的としている。
また,「ネガティブな例」からの学習が関心のクラス分類とセグメンテーションを促進することを示す。
我々のモデルはマイノリティ階級の病気を識別する上で特に強力であり、平均して3ポイント以上の改善をもたらす。
- 参考スコア(独自算出の注目度): 75.45394991863668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of deep learning relies heavily on large datasets with extensive
labels, but we often only have access to several small, heterogeneous datasets
associated with partial labels, particularly in the field of medical imaging.
When learning from multiple datasets, existing challenges include incomparable,
heterogeneous, or even conflicting labeling protocols across datasets. In this
paper, we propose a new initiative--"data, assemble"--which aims to unleash the
full potential of partially labeled data and enormous unlabeled data from an
assembly of datasets. To accommodate the supervised learning paradigm to
partial labels, we introduce a dynamic adapter that encodes multiple visual
tasks and aggregates image features in a question-and-answer manner.
Furthermore, we employ pseudo-labeling and consistency constraints to harness
images with missing labels and to mitigate the domain gap across datasets. From
proof-of-concept studies on three natural imaging datasets and rigorous
evaluations on two large-scale thorax X-ray benchmarks, we discover that
learning from "negative examples" facilitates both classification and
segmentation of classes of interest. This sheds new light on the computer-aided
diagnosis of rare diseases and emerging pandemics, wherein "positive examples"
are hard to collect, yet "negative examples" are relatively easier to assemble.
As a result, besides exceeding the prior art in the NIH ChestXray benchmark,
our model is particularly strong in identifying diseases of minority classes,
yielding over 3-point improvement on average. Remarkably, when using existing
partial labels, our model performance is on-par (p>0.05) with that using a
fully curated dataset with exhaustive labels, eliminating the need for
additional 40% annotation costs.
- Abstract(参考訳): ディープラーニングの成功は、広範なラベルを持つ大規模なデータセットに大きく依存していますが、部分的なラベルに関連する小さな異種データセット、特に医療画像の分野でのみアクセス可能です。
複数のデータセットから学ぶ場合、既存の課題には、データセット間の非互換性、異種、さらには競合するラベルプロトコルが含まれる。
本稿では,部分ラベル付きデータと膨大なラベル付きデータの全可能性を解き放つことを目的とした,新たなイニシアティブである"データ,アセンブル"を提案する。
教師付き学習パラダイムを部分ラベルに適合させるために,複数の視覚タスクを符号化し,問合せ方式で画像特徴を集約する動的アダプタを導入する。
さらに,ラベルの欠落した画像を活用するために擬似ラベルと一貫性の制約を適用し,データセット間のドメイン間ギャップを緩和する。
3つの自然画像データセットに関する概念実証研究と、2つの大規模胸部X線ベンチマークの厳密な評価から、「ネガティブな例」からの学習が興味のあるクラスの分類とセグメンテーションを促進することが判明した。
これは「ポジティブな例」は収集が難しいが「ネガティブな例」は比較的組み立てが容易な、まれな疾患や新興のパンデミックのコンピュータ支援診断に新たな光を当てている。
その結果,nih chestxrayベンチマークの先行技術を超えることに加えて,マイノリティクラスの疾患の同定においても,平均3点以上の改善が得られた。
驚くべきことに、既存の部分ラベルを使用する場合、モデルのパフォーマンスは、徹底したラベルを持つ完全にキュレートされたデータセットと同等(p>0.05)であり、追加で40%のアノテーションコストが不要である。
関連論文リスト
- Weakly-supervised diagnosis identification from Italian discharge letters [0.0]
本報告では, イタリアの退院状から病気を認識するための, 弱教師付きパイプラインを提案する。
私たちのパイプラインは、イタリアのUmbertoモデルの微調整バージョンをベースにしています。
論文 参考訳(メタデータ) (2024-10-19T09:42:20Z) - Automating Weak Label Generation for Data Programming with Clinicians in the Loop [5.729255216041754]
本稿では,データセットのいくつかの代表的なサンプルのラベルについて,専門家に問い合わせるアルゴリズムを提案する。
専門家によって割り当てられたラベルは、完全なデータセットのラベル付けを誘導し、データプログラミングパイプラインで使用される弱いラベルを生成する。
医療時系列調査では,3,265サンプル中50~130サブセットのラベル付けが17~28%,F1の13~28%の精度向上を示した。
論文 参考訳(メタデータ) (2024-07-10T18:29:22Z) - You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.27812493442062]
擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文 参考訳(メタデータ) (2024-06-19T17:58:40Z) - PatchSorter: A High Throughput Deep Learning Digital Pathology Tool for
Object Labeling [0.8290040611295051]
ディープラーニングと直感的なWebインターフェースを統合したオープンソースのラベリングツールであるPatchSorterをリリースしました。
我々は,ラベルの精度に最小限の影響を伴って,ラベルの1秒あたり7倍の改善を実証した。
論文 参考訳(メタデータ) (2023-07-13T09:32:42Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - MG-NET: Leveraging Pseudo-Imaging for Multi-Modal Metagenome Analysis [5.04905391284093]
本稿では,自己教師型表現学習フレームワークMG-Netを提案する。
MG-Netはラベルのないデータからロバストな表現を学習できることを示す。
実験により、学習した特徴が現在のベースラインメタジェノム表現より優れていることが示された。
論文 参考訳(メタデータ) (2021-07-21T05:53:01Z) - Boosting Semi-Supervised Face Recognition with Noise Robustness [54.342992887966616]
本稿では,自動ラベルによるラベル雑音に対して頑健な半教師付き顔認識に対する効果的な解法を提案する。
そこで我々は,gnが強化するロバストな学習能力に基づく,ノイズロバスト学習ラベリング(nroll)という,半教師付き顔認識ソリューションを開発した。
論文 参考訳(メタデータ) (2021-05-10T14:43:11Z) - Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions
Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。
wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。
新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文 参考訳(メタデータ) (2020-12-08T02:26:03Z) - A Novel Semi-Supervised Data-Driven Method for Chiller Fault Diagnosis
with Unlabeled Data [9.357969752339727]
そこで本研究では, 半世代対向ネットワークに基づくシラーシステムのための, 半教師付きデータ駆動型故障診断手法を提案する。
提案手法は診断精度を84%に向上させることができるが,教師付きベースライン法は最大で65%の精度にしか達しない。
論文 参考訳(メタデータ) (2020-10-31T04:57:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。