論文の概要: Information-theoretic Classification Accuracy: A Criterion that Guides
Data-driven Combination of Ambiguous Outcome Labels in Multi-class
Classification
- arxiv url: http://arxiv.org/abs/2109.00582v1
- Date: Wed, 1 Sep 2021 19:20:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-03 14:00:27.253131
- Title: Information-theoretic Classification Accuracy: A Criterion that Guides
Data-driven Combination of Ambiguous Outcome Labels in Multi-class
Classification
- Title(参考訳): 情報理論分類精度:多クラス分類における曖昧なアウトカムラベルのデータ駆動型組み合わせの指針
- Authors: Chihao Zhang, Yiling Elaine Chen, Shihua Zhang, Jingyi Jessica Li
- Abstract要約: 曖昧さと主観性を示すアウトカムラベリングは、現実世界のデータセットでユビキタスである。
そこで我々は,情報理論の分類精度 (ITCA) を提案し,あいまいな結果ラベルをどう組み合わせるかを実践者に対して指導する。
医療予後,癌生存予測,ユーザ人口予測,細胞型分類など,様々な応用におけるITCAの有効性を実証する。
- 参考スコア(独自算出の注目度): 3.9533511130413137
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Outcome labeling ambiguity and subjectivity are ubiquitous in real-world
datasets. While practitioners commonly combine ambiguous outcome labels in an
ad hoc way to improve the accuracy of multi-class classification, there lacks a
principled approach to guide label combination by any optimality criterion. To
address this problem, we propose the information-theoretic classification
accuracy (ITCA), a criterion of outcome "information" conditional on outcome
prediction, to guide practitioners on how to combine ambiguous outcome labels.
ITCA indicates a balance in the trade-off between prediction accuracy (how well
do predicted labels agree with actual labels) and prediction resolution (how
many labels are predictable). To find the optimal label combination indicated
by ITCA, we develop two search strategies: greedy search and breadth-first
search. Notably, ITCA and the two search strategies are adaptive to all
machine-learning classification algorithms. Coupled with a classification
algorithm and a search strategy, ITCA has two uses: to improve prediction
accuracy and to identify ambiguous labels. We first verify that ITCA achieves
high accuracy with both search strategies in finding the correct label
combinations on synthetic and real data. Then we demonstrate the effectiveness
of ITCA in diverse applications including medical prognosis, cancer survival
prediction, user demographics prediction, and cell type classification.
- Abstract(参考訳): 結果のラベル付け あいまいさと主観性は現実世界のデータセットにおいてユビキタスである。
実践者は通常、曖昧な結果ラベルをアドホックな方法で組み合わせ、多クラス分類の精度を向上させるが、最適な基準によってラベルの組み合わせを導くための原則的なアプローチが欠如している。
そこで本研究では,成果予測に基づく結果「情報」の基準であるitca(information-theoretic classification accuracy)を提案する。
itcaは、予測精度(予測ラベルと実際のラベルの一致度)と予測解像度(予測可能なラベル数)とのトレードオフのバランスを示している。
ITCAで示される最適なラベルの組み合わせを見つけるために、欲求検索と広義検索の2つの探索戦略を開発した。
特に、ITCAと2つの検索戦略は、すべての機械学習分類アルゴリズムに適応している。
分類アルゴリズムと検索戦略を組み合わせたITCAには,予測精度の向上と曖昧なラベルの識別という2つの方法がある。
まず,合成データと実データで正しいラベルの組み合わせを見つける際の検索戦略において,itcaが高い精度を達成することを検証した。
次に, 医療予後, 癌生存予測, ユーザ人口予測, 細胞型分類など, 多様な応用におけるITCAの有効性を示す。
関連論文リスト
- A Debiased Nearest Neighbors Framework for Multi-Label Text Classification [13.30576550077694]
マルチラベルテキスト分類(MLTC)のためのDebiased Nearest Neighbors(DENN)フレームワークについて紹介する。
組込みアライメントバイアスに対処するために,ラベル共起における近傍の一貫性を向上する,非バイアス付きコントラスト学習戦略を提案する。
信頼度推定バイアスには,$k$NNの予測と帰納的二分分類の適応的組み合わせを改善し,偏りのある信頼度推定戦略を提案する。
論文 参考訳(メタデータ) (2024-08-06T14:00:23Z) - Generating Unbiased Pseudo-labels via a Theoretically Guaranteed
Chebyshev Constraint to Unify Semi-supervised Classification and Regression [57.17120203327993]
分類におけるしきい値と擬似ラベルプロセス(T2L)は、ラベルの品質を決定するために信頼性を使用する。
本質的には、レグレッションは高品質なラベルを生成するためにバイアスのない方法も必要である。
チェビシェフの不等式に基づく不偏ラベルを生成するための理論的に保証された制約を提案する。
論文 参考訳(メタデータ) (2023-11-03T08:39:35Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Enhancing Label Correlation Feedback in Multi-Label Text Classification
via Multi-Task Learning [6.1538971100140145]
ラベル相関フィードバックを高めるために,マルチタスク学習を用いた新しい手法を提案する。
本稿では,ラベル相関学習を強化するための2つの補助ラベル共起予測タスクを提案する。
論文 参考訳(メタデータ) (2021-06-06T12:26:14Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Unsupervised Label Refinement Improves Dataless Text Classification [48.031421660674745]
データレステキスト分類は、ラベル記述と組み合わせた文書にスコアを割り当てることで、文書を未確認のラベルに分類することができる。
有望ながら、それは重要なダウンストリームタスクごとにラベルセットの正確な説明に依存します。
この依存により、データレス分類器はラベル記述の選択に非常に敏感になり、実際にはデータレス分類の幅広い適用を妨げる。
論文 参考訳(メタデータ) (2020-12-08T03:37:50Z) - SPL-MLL: Selecting Predictable Landmarks for Multi-Label Learning [87.27700889147144]
我々は、入力(予測可能)に応じて予測しやすく、他の可能なラベル(表現可能)をうまく回復できるランドマークとして、ラベルの小さなサブセットを選択することを提案する。
我々は,ADM(Alternating Direction Method)を用いてこの問題を解決する。実世界のデータセットに関する実証研究により,本手法が他の最先端手法よりも優れた分類性能を実現することを示す。
論文 参考訳(メタデータ) (2020-08-16T11:07:44Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Global Multiclass Classification and Dataset Construction via
Heterogeneous Local Experts [37.27708297562079]
得られたデータセットの信頼性を確保しながら、ラベルの数を最小化する方法を示す。
MNISTとCIFAR-10データセットを用いた実験では、アグリゲーション方式の良好な精度が示されている。
論文 参考訳(メタデータ) (2020-05-21T18:07:42Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。