論文の概要: Semi-supervised binary classification with latent distance learning
- arxiv url: http://arxiv.org/abs/2211.15153v1
- Date: Mon, 28 Nov 2022 09:05:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 18:50:19.895702
- Title: Semi-supervised binary classification with latent distance learning
- Title(参考訳): 潜在距離学習を用いた半教師付きバイナリ分類
- Authors: Imam Mustafa Kamal and Hyerim Bae
- Abstract要約: そこで本稿では,ランダムなk対クロス距離学習機構を持つラベルを用いて,二項分類問題を解くための新しい学習表現を提案する。
ラベルが少なく、データ拡張技術がないため、提案手法は最先端の半教師あり自己教師あり学習法より優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Binary classification (BC) is a practical task that is ubiquitous in
real-world problems, such as distinguishing healthy and unhealthy objects in
biomedical diagnostics and defective and non-defective products in
manufacturing inspections. Nonetheless, fully annotated data are commonly
required to effectively solve this problem, and their collection by domain
experts is a tedious and expensive procedure. In contrast to BC, several
significant semi-supervised learning techniques that heavily rely on stochastic
data augmentation techniques have been devised for solving multi-class
classification. In this study, we demonstrate that the stochastic data
augmentation technique is less suitable for solving typical BC problems because
it can omit crucial features that strictly distinguish between positive and
negative samples. To address this issue, we propose a new learning
representation to solve the BC problem using a few labels with a random k-pair
cross-distance learning mechanism. First, by harnessing a few labeled samples,
the encoder network learns the projection of positive and negative samples in
angular spaces to maximize and minimize their inter-class and intra-class
distances, respectively. Second, the classifier learns to discriminate between
positive and negative samples using on-the-fly labels generated based on the
angular space and labeled samples to solve BC tasks. Extensive experiments were
conducted using four real-world publicly available BC datasets. With few labels
and without any data augmentation techniques, the proposed method outperformed
state-of-the-art semi-supervised and self-supervised learning methods.
Moreover, with 10% labeling, our semi-supervised classifier could obtain
competitive accuracy compared with a fully supervised setting.
- Abstract(参考訳): バイナリ分類(BC)は、バイオメディカル診断における健康・不健康な物体の識別や、製造検査における欠陥・非欠陥製品など、現実的な問題においてユビキタスな実践課題である。
それでも、この問題を効果的に解決するために、完全に注釈付きデータが必要であり、ドメインの専門家による収集は退屈で高価な手順である。
BCとは対照的に、確率的データ拡張技術に大きく依存するいくつかの重要な半教師付き学習技術が、マルチクラス分類の解決のために考案された。
本研究では, 正と負のサンプルを厳密に区別する重要な特徴を省略できるため, 確率的データ拡張手法は典型的な bc 問題の解法には適さないことを示す。
そこで本研究では,ランダムなkペア間学習機構を持つラベルを用いて,bc問題を解くための新しい学習表現を提案する。
まず、いくつかのラベル付きサンプルを利用することで、エンコーダネットワークは、角空間における正と負のサンプルの投影を学習し、クラス間距離とクラス内距離を最大化し、最小化する。
第2に、分類器は、角空間とラベル付きサンプルに基づいて生成されたオンザフライラベルを用いて正と負のサンプルを判別し、bcタスクを解決する。
大規模な実験は4つのBCデータセットを用いて実施された。
ラベルが少なく、データ拡張技術がないため、提案手法は最先端の半教師あり自己教師あり学習法より優れていた。
さらに,10%のラベル付けにより,完全教師付き設定と比較して,半教師付き分類器が競争精度を得ることができた。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - DALSA: Domain Adaptation for Supervised Learning From Sparsely Annotated
MR Images [2.352695945685781]
そこで本研究では,自動腫瘍セグメンテーションのための教師あり学習において,スパースアノテーションによるサンプル選択誤差を補正するトランスファーラーニング手法を提案する。
提案手法は,スパースおよび曖昧なアノテーションから,異なる組織クラスに対する高品質な分類法を導出する。
完全ラベル付きデータを用いたトレーニングと比較して, ラベル付け時間とトレーニング時間は, 精度を犠牲にすることなく, 70倍, 180倍に短縮した。
論文 参考訳(メタデータ) (2024-03-12T09:17:21Z) - Performance Evaluation of Semi-supervised Learning Frameworks for
Multi-Class Weed Detection [15.828967396019143]
効率的な雑草防除は、収穫量を最適化し、農産物の品質を高める上で重要な役割を担っている。
MLとDLによって実現された精密雑草管理の最近の進歩は、持続可能な代替手段となる。
半教師あり学習法、特に半教師あり学習法は、コンピュータビジョンの幅広い領域において注目を集めている。
論文 参考訳(メタデータ) (2024-03-06T00:59:51Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Revisiting Class Imbalance for End-to-end Semi-Supervised Object
Detection [1.6249267147413524]
半教師付きオブジェクト検出(SSOD)は、擬似ラベルに基づくエンドツーエンド手法の開発において大きな進歩を遂げている。
多くの手法は、擬似ラベルジェネレータの有効性を妨げるクラス不均衡のため、課題に直面している。
本稿では,低品質な擬似ラベルの根本原因と,ラベル生成品質を改善するための新しい学習メカニズムについて検討する。
論文 参考訳(メタデータ) (2023-06-04T06:01:53Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - A multi-stage semi-supervised improved deep embedded clustering
(MS-SSIDEC) method for bearing fault diagnosis under the situation of
insufficient labeled samples [20.952315351460527]
実際の産業プロセスでデータにラベルをつけるのに多くの労力と時間を要するため、インテリジェントな故障診断手法の適用が困難になる。
この問題を解決するために,多段階半教師付き改良深層クラスタリング法(MS-SSIDEC)を提案する。
本手法は,事前学習,深層クラスタリング,教師付き学習の3段階を含む。
論文 参考訳(メタデータ) (2021-09-28T06:49:40Z) - Deep Semi-supervised Metric Learning with Dual Alignment for Cervical
Cancer Cell Detection [49.78612417406883]
子宮頸癌細胞検出のための新しい半教師付き深度測定法を提案する。
私たちのモデルは、埋め込みメトリック空間を学習し、提案レベルとプロトタイプレベルの両方でセマンティック機能の二重アライメントを行います。
本研究は,240,860個の頸部細胞画像からなる半監督型頸部がん細胞検出のための大規模データセットを初めて構築した。
論文 参考訳(メタデータ) (2021-04-07T17:11:27Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Semi-supervised and Unsupervised Methods for Heart Sounds Classification
in Restricted Data Environments [4.712158833534046]
本研究は、PhyloNet/CinC 2016 Challengeデータセット上で、様々な教師付き、半教師付き、教師なしのアプローチを用いる。
GANをベースとした半教師付き手法が提案され,非ラベルデータサンプルを用いてデータ分散の学習を促進できる。
特に、1D CNN Autoencoderと1クラスSVMを併用した教師なし特徴抽出は、データラベル付けなしで優れた性能が得られる。
論文 参考訳(メタデータ) (2020-06-04T02:07:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。