論文の概要: Multi-Task Label Discovery via Hierarchical Task Tokens for Partially Annotated Dense Predictions
- arxiv url: http://arxiv.org/abs/2411.18823v1
- Date: Wed, 27 Nov 2024 23:53:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:20:25.342815
- Title: Multi-Task Label Discovery via Hierarchical Task Tokens for Partially Annotated Dense Predictions
- Title(参考訳): 階層型タスクトークンによるマルチタスクラベル発見による部分的アノテーション付きDense予測
- Authors: Jingdong Zhang, Hanrong Ye, Xin Li, Wenping Wang, Dan Xu,
- Abstract要約: 学習可能な階層型タスクトークンの集合を最適化する新しい手法を提案する。
グローバルタスクトークンは、グローバルコンテキストにおける効果的なクロスタスク機能インタラクションのために設計されている。
各タスクに対するきめ細かいタスク固有の空間トークンのグループを、対応するグローバルタスクトークンから学習する。
学習されたグローバルおよび局所的な細粒度タスクトークンは、異なるレベルの粒度で擬似タスク固有の密度ラベルを発見するためにさらに使用される。
- 参考スコア(独自算出の注目度): 44.78165979575075
- License:
- Abstract: In recent years, simultaneous learning of multiple dense prediction tasks with partially annotated label data has emerged as an important research area. Previous works primarily focus on constructing cross-task consistency or conducting adversarial training to regularize cross-task predictions, which achieve promising performance improvements, while still suffering from the lack of direct pixel-wise supervision for multi-task dense predictions. To tackle this challenge, we propose a novel approach to optimize a set of learnable hierarchical task tokens, including global and fine-grained ones, to discover consistent pixel-wise supervision signals in both feature and prediction levels. Specifically, the global task tokens are designed for effective cross-task feature interactions in a global context. Then, a group of fine-grained task-specific spatial tokens for each task is learned from the corresponding global task tokens. It is embedded to have dense interactions with each task-specific feature map. The learned global and local fine-grained task tokens are further used to discover pseudo task-specific dense labels at different levels of granularity, and they can be utilized to directly supervise the learning of the multi-task dense prediction framework. Extensive experimental results on challenging NYUD-v2, Cityscapes, and PASCAL Context datasets demonstrate significant improvements over existing state-of-the-art methods for partially annotated multi-task dense prediction.
- Abstract(参考訳): 近年,注釈付きラベルデータを用いた複数の密集予測タスクの同時学習が重要な研究領域として浮上している。
従来の研究は、クロスタスクの一貫性の構築や、クロスタスクの予測を規則化するための敵の訓練の実施に重点を置いていたが、マルチタスクの高密度予測に対する画素単位の直接監督の欠如に悩まされていた。
この課題に対処するために,グローバルおよび微細なタスクトークンを含む学習可能な階層型タスクトークンの集合を最適化し,特徴レベルと予測レベルの両方において一貫した画素単位の監視信号を検出する手法を提案する。
具体的には、グローバルタスクトークンは、グローバルコンテキストにおける効果的なクロスタスク機能インタラクションのために設計されている。
そして、対応するグローバルなタスクトークンから、タスクごとにきめ細かいタスク固有の空間トークン群を学習する。
各タスク固有の特徴マップと密接な相互作用を持つように埋め込まれている。
学習されたグローバルおよび局所的な細粒度タスクトークンは、異なるレベルの粒度で擬似タスク固有の密集ラベルを発見するためにさらに使用され、マルチタスクの密集予測フレームワークの学習を直接監督するために利用することができる。
NYUD-v2、Cityscapes、PASCALコンテキストデータセットの挑戦に関する大規模な実験結果は、部分的に注釈付けされたマルチタスクの高密度予測のための既存の最先端手法よりも大幅に改善されていることを示している。
関連論文リスト
- Joint-Task Regularization for Partially Labeled Multi-Task Learning [30.823282043129552]
機械学習分野ではマルチタスク学習がますます人気になっているが、その実用性は大規模ラベル付きデータセットの必要性によって妨げられている。
本稿では, クロスタスク関係を利用して, 全タスクを1つのジョイントタスク潜在空間で同時に正規化する直感的手法であるジョイントタスク正規化(JTR)を提案する。
論文 参考訳(メタデータ) (2024-04-02T14:16:59Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Learning Multiple Dense Prediction Tasks from Partially Annotated Data [41.821234589075445]
マルチタスク部分教師付き学習(multi-task part-supervised learning)と呼ぶ部分注釈付きデータ上で,複数の密接な予測タスクを共同で学習する。
本稿では,タスク関係を利用したマルチタスク学習手法を提案する。
提案手法は,既存の半教師付き学習手法や関連手法を3つの標準ベンチマークで上回り,非ラベルなタスクで効果的に活用できることを厳密に実証する。
論文 参考訳(メタデータ) (2021-11-29T19:03:12Z) - MS-LaTTE: A Dataset of Where and When To-do Tasks are Completed [14.009925631455092]
我々はMS-LaTTEと呼ばれる新しい大規模データセットをリリースする。
タスク完了を取り巻くコンテキストの中核となる2つの側面(場所と時間)をキャプチャする。
本研究では,空間的タスクと時間的タスクの共起を予測する2つの問題に対して,データセットを検証した。
論文 参考訳(メタデータ) (2021-11-12T19:01:06Z) - Semi-supervised Multi-task Learning for Semantics and Depth [88.77716991603252]
MTL(Multi-Task Learning)は、関連するタスク間で表現を共有することで、モデル一般化を強化することを目的としている。
そこで本研究では,異なるデータセットから利用可能な監視信号を活用するために,半教師付きマルチタスク学習(MTL)手法を提案する。
本稿では,データセット間の整合性の問題を軽減するために,様々なアライメントの定式化を施したドメイン認識識別器構造を提案する。
論文 参考訳(メタデータ) (2021-10-14T07:43:39Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z) - Exploring Relational Context for Multi-Task Dense Prediction [76.86090370115]
我々は,共通バックボーンと独立タスク固有のヘッドで表される,密集予測タスクのためのマルチタスク環境を考える。
マルチタスク設定では,グローバルやローカルなど,さまざまな注意に基づくコンテキストを探索する。
タスクペアごとに利用可能なすべてのコンテキストのプールをサンプリングするAdaptive Task-Relational Contextモジュールを提案する。
論文 参考訳(メタデータ) (2021-04-28T16:45:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。