論文の概要: Semantics-Depth-Symbiosis: Deeply Coupled Semi-Supervised Learning of
Semantics and Depth
- arxiv url: http://arxiv.org/abs/2206.10562v1
- Date: Tue, 21 Jun 2022 17:40:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 19:09:30.323116
- Title: Semantics-Depth-Symbiosis: Deeply Coupled Semi-Supervised Learning of
Semantics and Depth
- Title(参考訳): 意味論-奥行き共生--意味論と奥行きの深い半教師付き学習
- Authors: Nitin Bansal, Pan Ji, Junsong Yuan, Yi Xu
- Abstract要約: 我々は,意味的セグメンテーションと深さ推定という2つの密なタスクのMTL問題に取り組み,クロスチャネル注意モジュール(CCAM)と呼ばれる新しいアテンションモジュールを提案する。
次に,AffineMixと呼ばれる予測深度を用いた意味分節タスクのための新しいデータ拡張と,ColorAugと呼ばれる予測セマンティクスを用いた単純な深度増分を定式化する。
最後に,提案手法の性能向上をCityscapesデータセットで検証し,深度と意味に基づく半教師付きジョイントモデルにおける最先端結果の実現を支援する。
- 参考スコア(独自算出の注目度): 83.94528876742096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-task learning (MTL) paradigm focuses on jointly learning two or more
tasks, aiming for significant improvement w.r.t model's generalizability,
performance, and training/inference memory footprint. The aforementioned
benefits become ever so indispensable in the case of joint training for
vision-related {\bf dense} prediction tasks. In this work, we tackle the MTL
problem of two dense tasks, \ie, semantic segmentation and depth estimation,
and present a novel attention module called Cross-Channel Attention Module
({CCAM}), which facilitates effective feature sharing along each channel
between the two tasks, leading to mutual performance gain with a negligible
increase in trainable parameters. In a true symbiotic spirit, we then formulate
a novel data augmentation for the semantic segmentation task using predicted
depth called {AffineMix}, and a simple depth augmentation using predicted
semantics called {ColorAug}. Finally, we validate the performance gain of the
proposed method on the Cityscapes dataset, which helps us achieve
state-of-the-art results for a semi-supervised joint model based on depth and
semantic segmentation.
- Abstract(参考訳): マルチタスク学習(MTL)パラダイムは、2つ以上のタスクを共同で学習することに焦点を当て、w.r.tモデルの一般化性、性能、トレーニング/推論メモリフットプリントの大幅な向上を目指している。
上記の利点は、視覚関連 {\bf dense} 予測タスクの合同訓練において必要不可欠なものとなる。
本研究では,2つの重み付きタスクのMTL問題である,セマンティックセグメンテーションと深度推定に取り組み,これら2つのタスク間のチャネル間の効果的な機能共有を容易にする,クロスチャネル注意モジュール({CCAM})を提案する。
真の共生精神では、予測深度(AffineMix)と予測深度(ColorAug)を用いてセマンティックセグメンテーションタスクのための新しいデータ拡張を定式化し、予測深度(ColorAug)を用いた単純な深度増強を行う。
最後に,提案手法の性能向上をCityscapesデータセットで検証し,深度とセマンティックセグメンテーションに基づく半教師付きジョイントモデルにおける最先端結果の実現を支援する。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Harnessing Diffusion Models for Visual Perception with Meta Prompts [68.78938846041767]
本稿では,視覚知覚タスクの拡散モデルを用いた簡易かつ効果的な手法を提案する。
学習可能な埋め込み(メタプロンプト)を事前学習した拡散モデルに導入し、知覚の適切な特徴を抽出する。
提案手法は,NYU 深度 V2 と KITTI の深度推定タスク,および CityScapes のセマンティックセグメンテーションタスクにおいて,新しい性能記録を実現する。
論文 参考訳(メタデータ) (2023-12-22T14:40:55Z) - IDEAL: Improved DEnse locAL Contrastive Learning for Semi-Supervised
Medical Image Segmentation [3.6748639131154315]
我々は,メートル法学習の概念をセグメンテーションタスクに拡張する。
本稿では,高密度画素レベルの特徴量を得るための単純な畳み込みプロジェクションヘッドを提案する。
下流タスクに対して,2ストリーム正規化トレーニングを含む双方向正規化機構を考案した。
論文 参考訳(メタデータ) (2022-10-26T23:11:02Z) - Learning to Relate Depth and Semantics for Unsupervised Domain
Adaptation [87.1188556802942]
教師なしドメイン適応(UDA)設定において,視覚的タスク関係を符号化してモデル性能を向上させる手法を提案する。
本稿では,意味的および深さ的予測のタスク依存性を符号化する新しいクロスタスク関係層(ctrl)を提案する。
さらに、セマンティック擬似ラベルを利用してターゲットドメインを監督する反復自己学習(ISL)トレーニングスキームを提案する。
論文 参考訳(メタデータ) (2021-05-17T13:42:09Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - An unsupervised deep learning framework via integrated optimization of
representation learning and GMM-based modeling [31.334196673143257]
本稿では,ディープ表現とGMMに基づくディープモデリングの両面において,共同学習の新たな原則を提案する。
類似分野の既存の作業と比較すると、目的関数は2つの学習目標を持ち、共同で最適化されるように作成される。
クラスタ間距離を小さくすることでクラスタのコンパクト性を著しく向上し、クラスタ間距離を増大させることで分離性を向上させる。
論文 参考訳(メタデータ) (2020-09-11T04:57:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。