論文の概要: Transferring Annotator- and Instance-dependent Transition Matrix for
Learning from Crowds
- arxiv url: http://arxiv.org/abs/2306.03116v1
- Date: Mon, 5 Jun 2023 13:43:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 19:11:42.763824
- Title: Transferring Annotator- and Instance-dependent Transition Matrix for
Learning from Crowds
- Title(参考訳): クラウドからの学習のためのアノテータおよびインスタンス依存遷移行列の転送
- Authors: Shikun Li, Xiaobo Xia, Jiankang Deng, Shiming Ge, Tongliang Liu
- Abstract要約: 現実のクラウドソーシングシナリオでは、ノイズ遷移行列はアノテータとインスタンスに依存します。
より現実的な問題として,一般のAIDTMを現実的に推定する手法を提案する。
実験により、合成および実世界のクラウドソーシングデータに対する提案手法の優位性が確認された。
- 参考スコア(独自算出の注目度): 82.54504926752284
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning from crowds describes that the annotations of training data are
obtained with crowd-sourcing services. Multiple annotators each complete their
own small part of the annotations, where labeling mistakes that depend on
annotators occur frequently. Modeling the label-noise generation process by the
noise transition matrix is a power tool to tackle the label noise. In
real-world crowd-sourcing scenarios, noise transition matrices are both
annotator- and instance-dependent. However, due to the high complexity of
annotator- and instance-dependent transition matrices (AIDTM),
\textit{annotation sparsity}, which means each annotator only labels a little
part of instances, makes modeling AIDTM very challenging. Prior works simplify
the problem by assuming the transition matrix is instance-independent or using
simple parametric way, while lose modeling generality. Motivated by this, we
target a more realistic problem, estimating general AIDTM in practice. Without
losing modeling generality, we parameterize AIDTM with deep neural networks. To
alleviate the modeling challenge, we suppose every annotator shares its noise
pattern with similar annotators, and estimate AIDTM via \textit{knowledge
transfer}. We hence first model the mixture of noise patterns by all
annotators, and then transfer this modeling to individual annotators.
Furthermore, considering that the transfer from the mixture of noise patterns
to individuals may cause two annotators with highly different noise generations
to perturb each other, we employ the knowledge transfer between identified
neighboring annotators to calibrate the modeling. Experiments confirm the
superiority of the proposed approach on synthetic and real-world crowd-sourcing
data. Source codes will be released.
- Abstract(参考訳): 群衆から学んだことは、トレーニングデータのアノテーションはクラウドソーシングサービスによって得られるということだ。
複数のアノテーションはそれぞれのアノテーションの小さな部分を完了し、アノテーションに依存するエラーのラベル付けが頻繁に発生する。
雑音遷移行列によるラベルノイズ生成過程のモデル化は、ラベルノイズに対処するためのパワーツールである。
実世界のクラウドソーシングシナリオでは、ノイズ遷移行列はアノテーションとインスタンスに依存します。
しかしながら、アノテーションとインスタンス依存遷移行列(AIDTM)の複雑さが高いため、各アノテーションはインスタンスのごく一部しかラベル付けしないため、AIDTMのモデリングは非常に困難である。
先行研究は、遷移行列がインスタンスに依存しない、あるいは単純なパラメトリックな方法で仮定することで問題を単純化し、モデリングの一般性を失う。
これを受けて、我々はより現実的な問題をターゲットに、現実的な一般AIDTMを推定する。
モデリングの一般性を失うことなく、深いニューラルネットワークでAIDTMをパラメータ化する。
モデリングの課題を軽減するため、全てのアノテータが類似のアノテータとノイズパターンを共有し、 \textit{knowledge transfer} を介してAIDTMを推定する。
したがって、まずすべてのアノテータによるノイズパターンの混合をモデル化し、それから個々のアノテータにこのモデリングを転送する。
さらに、ノイズパターンの混合から個人への変換が、非常に異なるノイズ世代を持つ2つのアノテータ間の摂動を引き起こす可能性があることを考慮し、同定された隣り合うアノテータ間の知識伝達を用いてモデリングを校正する。
実世界のクラウドソーシングデータに対する提案手法の優位性を実証する実験を行った。
ソースコードがリリースされる。
関連論文リスト
- Robust Learning under Hybrid Noise [24.36707245704713]
本稿では,データリカバリの観点からハイブリッドノイズに対処するため,新たな統合学習フレームワーク"Feature and Label Recovery"(FLR)を提案する。
論文 参考訳(メタデータ) (2024-07-04T16:13:25Z) - Federated Learning with Instance-Dependent Noisy Label [6.093214616626228]
FedBeatはIDN遷移行列(IDNTM)を用いたグローバルな統計的一貫した分類器の構築を目指している
CIFAR-10 と SVHN で行った実験により,提案手法が最先端手法を著しく上回っていることを確認した。
論文 参考訳(メタデータ) (2023-12-16T05:08:02Z) - Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios [23.43319138048058]
実践シナリオにおけるマルチモーダル感情認識(MER)は、欠落したデータや不完全なデータの存在によって著しく困難である。
従来の手法では、データを捨てたり、データセグメントをゼロベクトルで置換することで、これらの不完全性を近似することが多い。
本稿では,雑音データから頑健なマルチモーダル関節表現を効果的に学習する新しいノイズローバストMERモデルを提案する。
論文 参考訳(メタデータ) (2023-09-21T10:49:02Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Disjoint Contrastive Regression Learning for Multi-Sourced Annotations [10.159313152511919]
大規模データセットはディープラーニングモデルの開発に重要である。
複数のアノテータを使用して、データの異なるサブセットをラベル付けすることができる。
異なるアノテータ間の矛盾とバイアスはモデルトレーニングに有害である。
論文 参考訳(メタデータ) (2021-12-31T12:39:04Z) - Attention Bottlenecks for Multimodal Fusion [90.75885715478054]
機械知覚モデルは典型的にはモダリティに特化しており、単調なベンチマークのために最適化されている。
複数の層でのモジュラリティ融合に「融合」を用いる新しいトランスフォーマーアーキテクチャを導入する。
我々は、徹底的なアブレーション研究を行い、複数のオーディオ視覚分類ベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2021-06-30T22:44:12Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z) - Learning from Crowds by Modeling Common Confusions [33.92690297826468]
クラウドソーシングは、大量のラベル付きデータを低コストで取得する実用的な方法を提供する。
しかしアノテータのアノテーションの品質は様々である。
アノテーションノイズを共通のノイズと個々のノイズに分解する新しい視点を提供する。
論文 参考訳(メタデータ) (2020-12-24T01:13:23Z) - Learning to Generate Noise for Multi-Attack Robustness [126.23656251512762]
対人学習は、対人摂動に対する既存の方法の感受性を回避できる手法の1つとして登場した。
安全クリティカルなアプリケーションでは、攻撃者は様々な敵を採用してシステムを騙すことができるため、これらの手法は極端に便利である。
本稿では,複数種類の攻撃に対するモデルの堅牢性を改善するために,ノイズ発生を明示的に学習するメタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T10:44:05Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。