論文の概要: Open-Set Crowdsourcing using Multiple-Source Transfer Learning
- arxiv url: http://arxiv.org/abs/2111.04073v1
- Date: Sun, 7 Nov 2021 12:56:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-10 06:14:32.887388
- Title: Open-Set Crowdsourcing using Multiple-Source Transfer Learning
- Title(参考訳): 複数ソース変換学習を用いたオープンセットクラウドソーシング
- Authors: Guangyang Han, Guoxian Yu, Lei Liu, Lizhen Cui, Carlotta Domeniconi,
Xiangliang Zhang
- Abstract要約: 我々は、新しいクラウドソーシングシナリオ、オープンセットのクラウドソーシングを定義します。
これはまだタスクアノテートの問題であるが、タスクとラベル空間に対する不慣れさは、タスクとワーカーのモデリングを妨げている。
我々は,クラウドテーマ関連データセットを大規模なソースドメインに統合した直感的なソリューションOSCrowdを提案する。
- 参考スコア(独自算出の注目度): 48.411667950148164
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We raise and define a new crowdsourcing scenario, open set crowdsourcing,
where we only know the general theme of an unfamiliar crowdsourcing project,
and we don't know its label space, that is, the set of possible labels. This is
still a task annotating problem, but the unfamiliarity with the tasks and the
label space hampers the modelling of the task and of workers, and also the
truth inference. We propose an intuitive solution, OSCrowd. First, OSCrowd
integrates crowd theme related datasets into a large source domain to
facilitate partial transfer learning to approximate the label space inference
of these tasks. Next, it assigns weights to each source domain based on
category correlation. After this, it uses multiple-source open set transfer
learning to model crowd tasks and assign possible annotations. The label space
and annotations given by transfer learning will be used to guide and
standardize crowd workers' annotations. We validate OSCrowd in an online
scenario, and prove that OSCrowd solves the open set crowdsourcing problem,
works better than related crowdsourcing solutions.
- Abstract(参考訳): 私たちは新たなクラウドソーシングシナリオを提起し、定義しました。クラウドソーシングは、慣れ親しんだクラウドソーシングプロジェクトの一般的なテーマのみを知っていて、そのラベルスペース、すなわち可能なラベルのセットを知りません。
これはまだタスクアノテートの問題であるが、タスクとラベル空間に対する不慣れさは、タスクとワーカーのモデリング、そして真実の推論を妨げている。
我々は直感的なソリューションOSCrowdを提案する。
まず、oscrowdはクラウドテーマに関連するデータセットを大きなソースドメインに統合し、部分転送学習を容易にし、これらのタスクのラベル空間推定を近似する。
次に、カテゴリ相関に基づいて各ソースドメインに重みを割り当てる。
その後、複数のオープンソースの転送学習を使用して、クラウドタスクをモデル化し、可能なアノテーションを割り当てる。
転送学習によって与えられるラベル空間とアノテーションは、群衆労働者のアノテーションをガイドし標準化するために使用される。
我々は、OSCrowdをオンラインシナリオで検証し、OSCrowdがオープンセットのクラウドソーシング問題を解決することを証明する。
関連論文リスト
- Federated Learning with Only Positive Labels by Exploring Label Correlations [78.59613150221597]
フェデレートラーニングは、プライバシー上の制約の下で複数のユーザのデータを使用することで、モデルを協調的に学習することを目的としている。
本稿では,フェデレート学習環境下でのマルチラベル分類問題について検討する。
ラベル相関(FedALC)を探索してフェデレート平均化(Federated Averaging)と呼ばれる新しい,汎用的な手法を提案する。
論文 参考訳(メタデータ) (2024-04-24T02:22:50Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Label Selection Approach to Learning from Crowds [25.894399244406287]
Crowdsからの学習は、群衆労働者のラベル付きデータを使ってモデルを直接訓練するフレームワークである。
本稿では,選択型予測問題に対してSelectiveNetに着想を得た新しいLearning from Crowdsモデルを提案する。
提案手法の主な利点は、教師付き学習問題のほとんど全ての変種に適用できることである。
論文 参考訳(メタデータ) (2023-08-21T00:22:32Z) - Coreset Sampling from Open-Set for Fine-Grained Self-Supervised Learning [10.57079240576682]
本稿では,大規模未ラベルのオープンセットが利用可能であるという前提の下で,オープンセットの自己改善型学習問題を新たに導入する。
問題設定では、オープンセットとターゲットデータセットの分布ミスマッチを考慮することが重要である。
実験により,SimCoreは表現学習性能を大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-20T13:38:29Z) - Association Graph Learning for Multi-Task Classification with Category
Shifts [68.58829338426712]
関連する分類タスクが同じラベル空間を共有し、同時に学習されるマルチタスク分類に焦点を当てる。
我々は、不足クラスのためのタスク間で知識を伝達する関連グラフを学習する。
我々の手法は代表的基準よりも一貫して性能が良い。
論文 参考訳(メタデータ) (2022-10-10T12:37:41Z) - Identify ambiguous tasks combining crowdsourced labels by weighting
Areas Under the Margin [13.437403258942716]
曖昧なタスクは専門家の労働者を騙しかねない。
我々は、クラウドソースの学習シナリオにおいて、誤ってラベル付けされたデータを識別するために、AUM(Area Under the Margin)を適用する。
WAUMは、トレーニングセットからあいまいなタスクを捨てるのに役立ち、一般化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-09-30T11:16:20Z) - Creating Training Sets via Weak Indirect Supervision [66.77795318313372]
Weak Supervision (WS)フレームワークは、複数の潜在的にノイズの多い監督ソースからトレーニングラベルを合成する。
Weak Indirect Supervision (WIS) は、トレーニングラベルの自動合成のための新しい研究課題である。
我々は,ユーザが提供するラベル関係を利用して間接的な監督源をモデル化し活用する確率論的モデリング手法PLRMを開発した。
論文 参考訳(メタデータ) (2021-10-07T14:09:35Z) - Partial Domain Adaptation Using Selective Representation Learning For
Class-Weight Computation [19.67078163464389]
ディープラーニングモデルの一般化能力は、リッチラベルデータに依存する。
画像コンテンツ情報のみから外れたクラスを識別する手法を開発した。
また、ソース画像からクラスコンテンツのみにラベル分類器を訓練する。
論文 参考訳(メタデータ) (2021-01-06T21:37:56Z) - Federated Learning with Only Positive Labels [71.63836379169315]
FedAwS(Federated Averaging with Spreadout)という,正のラベルのみを用いたトレーニングのための汎用フレームワークを提案する。
理論的にも経験的にも、FedAwSは、ユーザが負のラベルにアクセス可能な従来の学習のパフォーマンスとほぼ一致していることを示す。
論文 参考訳(メタデータ) (2020-04-21T23:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。