論文の概要: TriangleNet: Edge Prior Augmented Network for Semantic Segmentation
through Cross-Task Consistency
- arxiv url: http://arxiv.org/abs/2210.05152v5
- Date: Wed, 30 Aug 2023 14:24:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-31 18:02:12.880065
- Title: TriangleNet: Edge Prior Augmented Network for Semantic Segmentation
through Cross-Task Consistency
- Title(参考訳): TriangleNet: クロスタスク一貫性によるセマンティックセグメンテーションのためのエッジ事前拡張ネットワーク
- Authors: Dan Zhang, Rui Zheng, Luosang Gadeng, Pei Yang
- Abstract要約: 本稿では,コンピュータビジョンにおけるセマンティックセグメンテーションの課題に対処する。
本稿では, クロスタスク一貫性を明示的に向上する「分離型クロスタスク一貫性損失」を提案する。
セマンティックセグメンテーションネットワークであるTriangleNetは、Cityscapesテストセット上のIntersection over Union(mIoU)の平均で、ベースラインよりも2.88%大幅に改善されている。
- 参考スコア(独自算出の注目度): 10.92477003580794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the task of semantic segmentation in computer vision,
aiming to achieve precise pixel-wise classification. We investigate the joint
training of models for semantic edge detection and semantic segmentation, which
has shown promise. However, implicit cross-task consistency learning in
multi-task networks is limited. To address this, we propose a novel "decoupled
cross-task consistency loss" that explicitly enhances cross-task consistency.
Our semantic segmentation network, TriangleNet, achieves a substantial 2.88\%
improvement over the Baseline in mean Intersection over Union (mIoU) on the
Cityscapes test set. Notably, TriangleNet operates at 77.4\% mIoU/46.2 FPS on
Cityscapes, showcasing real-time inference capabilities at full resolution.
With multi-scale inference, performance is further enhanced to 77.8\%.
Furthermore, TriangleNet consistently outperforms the Baseline on the FloodNet
dataset, demonstrating its robust generalization capabilities. The proposed
method underscores the significance of multi-task learning and explicit
cross-task consistency enhancement for advancing semantic segmentation and
highlights the potential of multitasking in real-time semantic segmentation.
- Abstract(参考訳): 本稿では,コンピュータビジョンにおける意味セグメンテーションの課題について述べる。
本稿では,意味的エッジ検出と意味的セグメンテーションのためのモデルの協調トレーニングについて検討する。
しかし、マルチタスクネットワークにおける暗黙のクロスタスク一貫性学習は限られている。
これを解決するために,クロスタスク一貫性を明示的に向上する「分離型クロスタスク一貫性損失」を提案する。
セマンティックセグメンテーションネットワークであるTriangleNetは、Cityscapesテストセット上のIntersection over Union(mIoU)の平均でベースラインよりも2.88倍の大幅な改善を実現しています。
特にTriangleNetは、Cityscapes上で77.4\% mIoU/46.2 FPSで動作し、フル解像度でリアルタイム推論機能を示す。
マルチスケール推論により、パフォーマンスはさらに77.8\%向上する。
さらにTriangleNetは、FloodNetデータセットのBaselineを一貫して上回り、堅牢な一般化機能を示している。
提案手法は,セマンティックセグメンテーションの進行におけるマルチタスク学習の重要性と,セマンティックセグメンテーションにおけるマルチタスクの可能性を強調した。
関連論文リスト
- A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - The revenge of BiSeNet: Efficient Multi-Task Image Segmentation [6.172605433695617]
BiSeNetFormerは、効率的なマルチタスク画像セグメンテーションのための新しいアーキテクチャである。
複数のタスクをシームレスにサポートすることで、BiSeNetFormerはマルチタスクセグメンテーションのための汎用的なソリューションを提供する。
以上の結果から, BiSeNetFormerは高速, 効率的, マルチタスクセグメンテーションネットワークへの大きな進歩を示していることが示唆された。
論文 参考訳(メタデータ) (2024-04-15T08:32:18Z) - HS3: Learning with Proper Task Complexity in Hierarchically Supervised
Semantic Segmentation [81.87943324048756]
本稿では,タスクの複雑さによって意味のある表現を学習するためのセグメンテーションネットワークの中間層を監督するトレーニングスキームである階層的意味論(Hierarchically Supervised Semantic,HS3)を提案する。
提案するHS3-Fuseフレームワークはセグメンテーション予測をさらに改善し、2つの大きなセグメンテーションベンチマークであるNYUD-v2とCityscapesで最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-03T16:33:29Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z) - Empirical Study of Multi-Task Hourglass Model for Semantic Segmentation
Task [0.7614628596146599]
エッジ検出, 意味輪郭, 距離変換タスクを用いて, セマンティックセグメンテーションタスクを補完するマルチタスク手法を提案する。
本研究では,Cityscapes,CamVid,Freiburg Forestの各データセットにおける時間ガラスモデルのマルチタスク環境における学習の有効性を示す。
論文 参考訳(メタデータ) (2021-05-28T01:08:10Z) - Learning to Relate Depth and Semantics for Unsupervised Domain
Adaptation [87.1188556802942]
教師なしドメイン適応(UDA)設定において,視覚的タスク関係を符号化してモデル性能を向上させる手法を提案する。
本稿では,意味的および深さ的予測のタスク依存性を符号化する新しいクロスタスク関係層(ctrl)を提案する。
さらに、セマンティック擬似ラベルを利用してターゲットドメインを監督する反復自己学習(ISL)トレーニングスキームを提案する。
論文 参考訳(メタデータ) (2021-05-17T13:42:09Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - JSENet: Joint Semantic Segmentation and Edge Detection Network for 3D
Point Clouds [37.703770427574476]
本稿では,初めて3次元意味的エッジ検出タスクに取り組む。
本稿では,2つのタスクを共同で行う2ストリーム完全畳み込みネットワークを提案する。
特に,両タスクの性能向上のために,領域情報とエッジ情報を明示的に関連付ける共同改良モジュールを設計する。
論文 参考訳(メタデータ) (2020-07-14T08:00:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。