Fugu-MT 論文翻訳(概要): Transferring Annotator- and Instance-dependent Transition Matrix for Learning from Crowds

論文の概要: Transferring Annotator- and Instance-dependent Transition Matrix for Learning from Crowds

arxiv url: http://arxiv.org/abs/2306.03116v3
Date: Sun, 14 Apr 2024 11:08:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-17 00:07:07.289712
Title: Transferring Annotator- and Instance-dependent Transition Matrix for Learning from Crowds
Title（参考訳）: クラウドからの学習のためのアノテータおよびインスタンス依存遷移行列の転送
Authors: Shikun Li, Xiaobo Xia, Jiankang Deng, Shiming Ge, Tongliang Liu,
Abstract要約: 現実のクラウドソーシングシナリオでは、ノイズ遷移行列はアノテータとインスタンスに依存します。まず、すべてのアノテータによるノイズパターンの混合をモデル化し、その後、個々のアノテータにこのモデリングを転送する。実験により、合成および実世界のクラウドソーシングデータに対する提案手法の優位性が確認された。
参考スコア（独自算出の注目度）: 88.06545572893455
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Learning from crowds describes that the annotations of training data are obtained with crowd-sourcing services. Multiple annotators each complete their own small part of the annotations, where labeling mistakes that depend on annotators occur frequently. Modeling the label-noise generation process by the noise transition matrix is a power tool to tackle the label noise. In real-world crowd-sourcing scenarios, noise transition matrices are both annotator- and instance-dependent. However, due to the high complexity of annotator- and instance-dependent transition matrices (AIDTM), annotation sparsity, which means each annotator only labels a little part of instances, makes modeling AIDTM very challenging. Prior works simplify the problem by assuming the transition matrix is instance-independent or using simple parametric ways, which lose modeling generality. Motivated by this, we target a more realistic problem, estimating general AIDTM in practice. Without losing modeling generality, we parameterize AIDTM with deep neural networks. To alleviate the modeling challenge, we suppose every annotator shares its noise pattern with similar annotators, and estimate AIDTM via knowledge transfer. We hence first model the mixture of noise patterns by all annotators, and then transfer this modeling to individual annotators. Furthermore, considering that the transfer from the mixture of noise patterns to individuals may cause two annotators with highly different noise generations to perturb each other, we employ the knowledge transfer between identified neighboring annotators to calibrate the modeling. Theoretical analyses are derived to demonstrate that both the knowledge transfer from global to individuals and the knowledge transfer between neighboring individuals can help model general AIDTM. Experiments confirm the superiority of the proposed approach on synthetic and real-world crowd-sourcing data.
Abstract（参考訳）: 群衆から学んだことは、トレーニングデータのアノテーションはクラウドソーシングサービスによって得られるということだ。複数のアノテーションはそれぞれのアノテーションの小さな部分を完了し、アノテーションに依存するエラーのラベル付けが頻繁に発生する。ノイズ遷移行列によるラベルノイズ生成過程のモデル化は,ラベルノイズに対処するためのパワーツールである。現実のクラウドソーシングシナリオでは、ノイズ遷移行列はアノテータとインスタンスに依存します。しかし、アノテータとインスタンス依存遷移行列(AIDTM)の複雑さが高いため、各アノテータはインスタンスのごく一部しかラベル付けしないため、AIDTMのモデリングは非常に困難である。先行研究は、遷移行列がインスタンス非依存であるか、あるいは単純なパラメトリックな方法で仮定することで問題を単純化し、モデリングの一般性を失う。これを受けて、我々はより現実的な問題をターゲットに、現実的な一般AIDTMを推定する。モデリングの一般性を失うことなく、AIDTMをディープニューラルネットワークでパラメータ化する。モデリングの課題を軽減するため、全てのアノテータが類似のアノテータとノイズパターンを共有し、知識伝達を介してAIDTMを推定する。したがって、まずすべてのアノテータによるノイズパターンの混合をモデル化し、それから個々のアノテータにこのモデリングを転送する。さらに、ノイズパターンの混合から個人への変換が、非常に異なるノイズ世代を持つ2つのアノテータ間の摂動を引き起こす可能性があることを考慮し、同定された隣り合うアノテータ間の知識伝達を用いてモデリングを校正する。理論分析は、グローバルから個人への知識伝達と、近隣の個人間の知識伝達の両方が一般的なAIDTMのモデル化に役立つことを示すために導かれる。実験により、合成および実世界のクラウドソーシングデータに対する提案手法の優位性が確認された。

関連論文リスト

Test-time Adaptive Hierarchical Co-enhanced Denoising Network for Reliable Multimodal Classification [55.56234913868664]
マルチモーダルデータを用いた信頼性学習のためのTAHCD(Test-time Adaptive Hierarchical Co-enhanced Denoising Network)を提案する。提案手法は,最先端の信頼性の高いマルチモーダル学習手法と比較して,優れた分類性能,堅牢性,一般化を実現する。
論文参考訳（メタデータ） (2026-01-12T03:14:12Z)
Towards Unified Multimodal Misinformation Detection in Social Media: A Benchmark Dataset and Baseline [56.790045049514326]
詐欺の2つの主要な形態は、人造誤報とAI生成コンテンツである。両形態の偽造を扱うためのフレームワークであるUMFDet(Unified Multimodal Fake Content Detection)を提案する。 UMFDetは、両方の誤情報型に対して堅牢で一貫したパフォーマンスを実現し、特殊ベースラインを上回っている。
論文参考訳（メタデータ） (2025-09-30T09:26:32Z)
QuMAB: Query-based Multi-Annotator Behavior Modeling with Reliability under Sparse Labels [23.555446749682467]
マルチアノテーション学習は伝統的に、様々なアノテーションを集約して単一の真実を近似し、不一致をノイズとして扱う。本稿では,サンプル・ワイド・アグリゲーションからアノテータ・ワイド・ビヘイビア・モデリングへのパラダイムシフトを紹介する。アノテータの不一致をノイズではなく貴重な情報として扱うことにより、アノテータ固有の行動パターンをモデル化することで、未ラベルデータを再構築してアノテーションコストを低減し、集約信頼性を高め、アノテータの決定動作を説明することができる。
論文参考訳（メタデータ） (2025-07-23T16:17:43Z)
Reinforced Interactive Continual Learning via Real-time Noisy Human Feedback [59.768119380109084]
本稿では,AIモデルがリアルタイムフィードバックから新たなスキルを動的に学習する対話型連続学習パラダイムを提案する。大規模言語モデル(LLM)を活用した強化型対話型連続学習フレームワークRiCLを提案する。我々のRiCLアプローチは、最先端のオンライン連続学習とノイズラベル学習の既存の組み合わせを大幅に上回っている。
論文参考訳（メタデータ） (2025-05-15T03:22:03Z)
Classifying Long-tailed and Label-noise Data via Disentangling and Unlearning [58.052712054684946]
実世界のデータセットでは、長い尾の分布とノイズラベルの課題はしばしば共存する。本稿では,長い尾とラベルノイズデータに対するディスタングルとアンラーニングという新しい手法を提案する。
論文参考訳（メタデータ） (2025-03-14T13:58:27Z)
Robust Learning under Hybrid Noise [24.36707245704713]
本稿では,データリカバリの観点からハイブリッドノイズに対処するため,新たな統合学習フレームワーク"Feature and Label Recovery"(FLR)を提案する。
論文参考訳（メタデータ） (2024-07-04T16:13:25Z)
Federated Learning with Instance-Dependent Noisy Label [6.093214616626228]
FedBeatはIDN遷移行列(IDNTM)を用いたグローバルな統計的一貫した分類器の構築を目指している CIFAR-10 と SVHN で行った実験により,提案手法が最先端手法を著しく上回っていることを確認した。
論文参考訳（メタデータ） (2023-12-16T05:08:02Z)
Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios [23.43319138048058]
実践シナリオにおけるマルチモーダル感情認識(MER)は、欠落したデータや不完全なデータの存在によって著しく困難である。従来の手法では、データを捨てたり、データセグメントをゼロベクトルで置換することで、これらの不完全性を近似することが多い。本稿では,雑音データから頑健なマルチモーダル関節表現を効果的に学習する新しいノイズローバストMERモデルを提案する。
論文参考訳（メタデータ） (2023-09-21T10:49:02Z)
Decoupled Multi-task Learning with Cyclical Self-Regulation for Face Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2022-03-28T02:12:30Z)
Disjoint Contrastive Regression Learning for Multi-Sourced Annotations [10.159313152511919]
大規模データセットはディープラーニングモデルの開発に重要である。複数のアノテータを使用して、データの異なるサブセットをラベル付けすることができる。異なるアノテータ間の矛盾とバイアスはモデルトレーニングに有害である。
論文参考訳（メタデータ） (2021-12-31T12:39:04Z)
Attention Bottlenecks for Multimodal Fusion [90.75885715478054]
機械知覚モデルは典型的にはモダリティに特化しており、単調なベンチマークのために最適化されている。複数の層でのモジュラリティ融合に「融合」を用いる新しいトランスフォーマーアーキテクチャを導入する。我々は、徹底的なアブレーション研究を行い、複数のオーディオ視覚分類ベンチマークで最先端の結果を得る。
論文参考訳（メタデータ） (2021-06-30T22:44:12Z)
Tackling Instance-Dependent Label Noise via a Universal Probabilistic Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文参考訳（メタデータ） (2021-01-14T05:43:51Z)
Learning from Crowds by Modeling Common Confusions [33.92690297826468]
クラウドソーシングは、大量のラベル付きデータを低コストで取得する実用的な方法を提供する。しかしアノテータのアノテーションの品質は様々である。アノテーションノイズを共通のノイズと個々のノイズに分解する新しい視点を提供する。
論文参考訳（メタデータ） (2020-12-24T01:13:23Z)
Learning to Generate Noise for Multi-Attack Robustness [126.23656251512762]
対人学習は、対人摂動に対する既存の方法の感受性を回避できる手法の1つとして登場した。安全クリティカルなアプリケーションでは、攻撃者は様々な敵を採用してシステムを騙すことができるため、これらの手法は極端に便利である。本稿では,複数種類の攻撃に対するモデルの堅牢性を改善するために,ノイズ発生を明示的に学習するメタラーニングフレームワークを提案する。
論文参考訳（メタデータ） (2020-06-22T10:44:05Z)
AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。 3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文参考訳（メタデータ） (2020-01-15T18:32:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。