論文の概要: Understanding the Essence: Delving into Annotator Prototype Learning for Multi-Class Annotation Aggregation
- arxiv url: http://arxiv.org/abs/2508.02123v1
- Date: Mon, 04 Aug 2025 07:04:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.214376
- Title: Understanding the Essence: Delving into Annotator Prototype Learning for Multi-Class Annotation Aggregation
- Title(参考訳): 意味を理解する:マルチクラスアノテーションアグリゲーションのためのアノテーションプロトタイプ学習に夢中になる
- Authors: Ju Chen, Jun Feng, Shenyu Zhang,
- Abstract要約: 既存の最先端の手法は通常、混乱行列を用いて各アノテータの専門知識をモデル化する。
そこで本研究では,新しい混乱行列法であるPTBCCを提案し,プロトタイプ学習によるより信頼性の高いアノテータ推定手法を提案する。
PTBCCは、ベストケースで最大15%の精度を達成し、計算コストを90%以上削減しながら平均精度を3%向上させる。
- 参考スコア(独自算出の注目度): 3.547712674318918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-class classification annotations have significantly advanced AI applications, with truth inference serving as a critical technique for aggregating noisy and biased annotations. Existing state-of-the-art methods typically model each annotator's expertise using a confusion matrix. However, these methods suffer from two widely recognized issues: 1) when most annotators label only a few tasks, or when classes are imbalanced, the estimated confusion matrices are unreliable, and 2) a single confusion matrix often remains inadequate for capturing each annotator's full expertise patterns across all tasks. To address these issues, we propose a novel confusion-matrix-based method, PTBCC (ProtoType learning-driven Bayesian Classifier Combination), to introduce a reliable and richer annotator estimation by prototype learning. Specifically, we assume that there exists a set $S$ of prototype confusion matrices, which capture the inherent expertise patterns of all annotators. Rather than a single confusion matrix, the expertise per annotator is extended as a Dirichlet prior distribution over these prototypes. This prototype learning-driven mechanism circumvents the data sparsity and class imbalance issues, ensuring a richer and more flexible characterization of annotators. Extensive experiments on 11 real-world datasets demonstrate that PTBCC achieves up to a 15% accuracy improvement in the best case, and a 3% higher average accuracy while reducing computational cost by over 90%.
- Abstract(参考訳): マルチクラス分類アノテーションは、真理推論がノイズやバイアスのあるアノテーションを集約するための重要なテクニックとして機能する、かなり高度なAIアプリケーションを持っている。
既存の最先端の手法は通常、混乱行列を用いて各アノテータの専門知識をモデル化する。
しかし、これらの方法は広く認識されている2つの問題に悩まされている。
1)ほとんどのアノテータがいくつかのタスクのみをラベル付けしている場合、またはクラスが不均衡である場合、推定される混乱行列は信頼できない。
2) 単一の混乱行列は、各アノテータのすべての専門的パターンを全てのタスクにわたって捉えるのに不十分なままであることが多い。
これらの問題に対処するため,本研究では, PTBCC (ProtoType Learning-driven Bayesian Classifier Combination) を新たに提案する。
具体的には、すべてのアノテータの固有の専門的パターンをキャプチャする、プロトタイプの混乱行列のセット$S$が存在すると仮定する。
単一の混乱行列ではなく、アノテータごとの専門知識は、これらのプロトタイプに対するディリクレの事前分布として拡張される。
このプロトタイプの学習駆動機構は、データ空間とクラス不均衡の問題を回避し、アノテータのよりリッチで柔軟な特徴を確実にする。
11の実世界のデータセットに対する大規模な実験により、TBCCはベストケースで最大15%の精度向上を実現し、計算コストを90%以上削減しながら平均精度を3%向上した。
関連論文リスト
- Kernel-Free Universum Quadratic Surface Twin Support Vector Machines for Imbalanced Data [1.8990839669542954]
不均衡なクラスを持つバイナリ分類タスクは、機械学習において大きな課題となる。
本稿では,2次双立サポートベクトルマシンモデル内のマイノリティクラスをサポートするためにUniversumポイントを活用することで,この問題に対処する新しいアプローチを提案する。
本手法は,Universumの点を組み込むことで,不均衡なデータセットの分類精度と一般化性能を向上させる。
論文 参考訳(メタデータ) (2024-12-02T19:57:59Z) - LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率のよいアンサンブル手法であるLoRA-Ensembleを紹介する。
この方法は、BatchEnsembleのような最先端の暗黙のテクニックを上回るだけでなく、Explicit Ensembleの正確さにマッチするか超える。
論文 参考訳(メタデータ) (2024-05-23T11:10:32Z) - Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery [23.359450657842686]
Generalized Class Discovery (GCD) はラベル付きデータから学んだ知識に基づいてラベルを部分的にラベル付きデータに動的に割り当てることを目的としている。
本稿では,学習可能な潜在的なプロトタイプを導入し,クラスタプロトタイプを拡張する適応型探索機構を提案する。
我々の手法は、スタンフォード・カーズ・データセットの9.7%の差で、最も近い競合相手を上回っている。
論文 参考訳(メタデータ) (2024-04-13T12:41:40Z) - Coupled Confusion Correction: Learning from Crowds with Sparse
Annotations [43.94012824749425]
2つのモデルで学習した融合行列は、他のモデルの蒸留データによって補正することができる。
我々は、類似の専門知識を共有するアノテータグループの'をクラスタ化し、それらの混乱行列を一緒に修正できるようにします。
論文 参考訳(メタデータ) (2023-12-12T14:47:26Z) - A Robust Twin Parametric Margin Support Vector Machine for Multiclass Classification [0.0]
本稿では,特徴不確実性を考慮したマルチクラス分類タスクに対処する新しいTPMSVMモデルを提案する。
データ摂動に対処するため、各トレーニング観測の周囲に有界・北不確実性セットを構築し、決定論的モデルのロバストな特徴を導出する。
実世界のデータセットに対する頑健なマルチクラスTPMSVM手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-06-09T19:27:24Z) - Transferring Annotator- and Instance-dependent Transition Matrix for Learning from Crowds [88.06545572893455]
現実のクラウドソーシングシナリオでは、ノイズ遷移行列はアノテータとインスタンスに依存します。
まず、すべてのアノテータによるノイズパターンの混合をモデル化し、その後、個々のアノテータにこのモデリングを転送する。
実験により、合成および実世界のクラウドソーシングデータに対する提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2023-06-05T13:43:29Z) - Relieving Long-tailed Instance Segmentation via Pairwise Class Balance [85.53585498649252]
長い尾のインスタンスセグメンテーションは、クラス間のトレーニングサンプルの極端な不均衡のために難しいタスクである。
尾のついたものに対して、(大多数のサンプルを含む)ヘッドクラスの深刻なバイアスを引き起こす。
そこで本研究では,学習中の予測嗜好を蓄積するために,学習中に更新される混乱行列上に構築された新しいPairwise Class Balance(PCB)手法を提案する。
論文 参考訳(メタデータ) (2022-01-08T07:48:36Z) - Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。
プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。
我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文 参考訳(メタデータ) (2021-10-22T01:55:01Z) - High-dimensional separability for one- and few-shot learning [58.8599521537]
この作業は、実用的な質問、人工知能(AI)エラーの修正によって進められている。
特殊な外部デバイスである修正器が開発されている。従来のAIシステムを変更することなく、迅速かつ非イテレーティブなシステム修正を提供する必要がある。
AIシステムの新しいマルチコレクタが提示され、深層畳み込みニューラルネットワークによってエラーを予測し、新しいクラスのオブジェクトを学習する例が紹介される。
論文 参考訳(メタデータ) (2021-06-28T14:58:14Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Lifelong Learning Without a Task Oracle [13.331659934508764]
監視されたディープニューラルネットワークは、新しいタスクが学習されると、古いタスクの精度が大幅に低下することが知られている。
本稿では,メモリオーバーヘッドの少ないタスク割り当てマップの提案と比較を行う。
最高のパフォーマンスの変種は、平均的なパラメータメモリの増大を1.7%に抑えるだけである。
論文 参考訳(メタデータ) (2020-11-09T21:30:31Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。