論文の概要: Label-Assemble: Leveraging Multiple Datasets with Partial Labels
- arxiv url: http://arxiv.org/abs/2109.12265v4
- Date: Sun, 14 May 2023 14:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 01:41:50.652070
- Title: Label-Assemble: Leveraging Multiple Datasets with Partial Labels
- Title(参考訳): Label-Assemble: 部分ラベルによる複数データセットの活用
- Authors: Mintong Kang, Bowen Li, Zengle Zhu, Yongyi Lu, Elliot K. Fishman, Alan
L. Yuille, Zongwei Zhou
- Abstract要約: Label-Assemble”は、公開データセットのアセンブリから部分的なラベルの可能性を最大限に活用することを目的としている。
陰例からの学習は,コンピュータ支援型疾患の診断と検出の双方を促進することが判明した。
- 参考スコア(独自算出の注目度): 68.46767639240564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of deep learning relies heavily on large labeled datasets, but we
often only have access to several small datasets associated with partial
labels. To address this problem, we propose a new initiative, "Label-Assemble",
that aims to unleash the full potential of partial labels from an assembly of
public datasets. We discovered that learning from negative examples facilitates
both computer-aided disease diagnosis and detection. This discovery will be
particularly crucial in novel disease diagnosis, where positive examples are
hard to collect, yet negative examples are relatively easier to assemble. For
example, assembling existing labels from NIH ChestX-ray14 (available since
2017) significantly improves the accuracy of COVID-19 diagnosis from 96.3% to
99.3%. In addition to diagnosis, assembling labels can also improve disease
detection, e.g., the detection of pancreatic ductal adenocarcinoma (PDAC) can
greatly benefit from leveraging the labels of Cysts and PanNets (two other
types of pancreatic abnormalities), increasing sensitivity from 52.1% to 84.0%
while maintaining a high specificity of 98.0%.
- Abstract(参考訳): ディープラーニングの成功は、大きなラベル付きデータセットに大きく依存していますが、部分ラベルに関連するいくつかの小さなデータセットにしかアクセスできません。
この問題に対処するため,我々は,公開データセットのアセンブリから部分ラベルの可能性を解き放つことを目的とした,新たなイニシアティブ "label-assemble" を提案する。
ネガティブな例から学ぶことで,コンピュータ支援型疾患の診断と検出が容易になることがわかった。
この発見は、陽性例の収集が難しいが、陰性例の組み立てが比較的容易な、新しい疾患診断において特に重要である。
例えば、NIH ChestX-ray14(2017年以降利用可能)から既存のラベルを組み込むことで、新型コロナウイルスの診断精度が96.3%から99.3%に大幅に向上する。
例えば、膵管腺癌(PDAC)の検出は、CystsおよびPanNets(他の2種類の膵異常)のラベルを利用することで、感度を52.1%から84.0%に上昇させ、98.0%の高比性を維持しながら、疾患の検出を改善することができる。
関連論文リスト
- Weakly-supervised diagnosis identification from Italian discharge letters [0.0]
本報告では, イタリアの退院状から病気を認識するための, 弱教師付きパイプラインを提案する。
私たちのパイプラインは、イタリアのUmbertoモデルの微調整バージョンをベースにしています。
論文 参考訳(メタデータ) (2024-10-19T09:42:20Z) - Automating Weak Label Generation for Data Programming with Clinicians in the Loop [5.729255216041754]
本稿では,データセットのいくつかの代表的なサンプルのラベルについて,専門家に問い合わせるアルゴリズムを提案する。
専門家によって割り当てられたラベルは、完全なデータセットのラベル付けを誘導し、データプログラミングパイプラインで使用される弱いラベルを生成する。
医療時系列調査では,3,265サンプル中50~130サブセットのラベル付けが17~28%,F1の13~28%の精度向上を示した。
論文 参考訳(メタデータ) (2024-07-10T18:29:22Z) - You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.27812493442062]
擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文 参考訳(メタデータ) (2024-06-19T17:58:40Z) - PatchSorter: A High Throughput Deep Learning Digital Pathology Tool for
Object Labeling [0.8290040611295051]
ディープラーニングと直感的なWebインターフェースを統合したオープンソースのラベリングツールであるPatchSorterをリリースしました。
我々は,ラベルの精度に最小限の影響を伴って,ラベルの1秒あたり7倍の改善を実証した。
論文 参考訳(メタデータ) (2023-07-13T09:32:42Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - MG-NET: Leveraging Pseudo-Imaging for Multi-Modal Metagenome Analysis [5.04905391284093]
本稿では,自己教師型表現学習フレームワークMG-Netを提案する。
MG-Netはラベルのないデータからロバストな表現を学習できることを示す。
実験により、学習した特徴が現在のベースラインメタジェノム表現より優れていることが示された。
論文 参考訳(メタデータ) (2021-07-21T05:53:01Z) - Boosting Semi-Supervised Face Recognition with Noise Robustness [54.342992887966616]
本稿では,自動ラベルによるラベル雑音に対して頑健な半教師付き顔認識に対する効果的な解法を提案する。
そこで我々は,gnが強化するロバストな学習能力に基づく,ノイズロバスト学習ラベリング(nroll)という,半教師付き顔認識ソリューションを開発した。
論文 参考訳(メタデータ) (2021-05-10T14:43:11Z) - Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions
Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。
wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。
新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文 参考訳(メタデータ) (2020-12-08T02:26:03Z) - A Novel Semi-Supervised Data-Driven Method for Chiller Fault Diagnosis
with Unlabeled Data [9.357969752339727]
そこで本研究では, 半世代対向ネットワークに基づくシラーシステムのための, 半教師付きデータ駆動型故障診断手法を提案する。
提案手法は診断精度を84%に向上させることができるが,教師付きベースライン法は最大で65%の精度にしか達しない。
論文 参考訳(メタデータ) (2020-10-31T04:57:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。