論文の概要: C-DLinkNet: considering multi-level semantic features for human parsing
- arxiv url: http://arxiv.org/abs/2001.11690v2
- Date: Sun, 5 Apr 2020 11:12:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 06:38:00.691312
- Title: C-DLinkNet: considering multi-level semantic features for human parsing
- Title(参考訳): c-dlinknet: パースのためのマルチレベルセマンティクス機能の検討
- Authors: Yu Lu, Muyan Feng, Ming Wu, Chuang Zhang
- Abstract要約: 本稿では、LinkNetに基づくC-DLinkNetと呼ばれるエンドツーエンドモデルを提案する。
C-DLinkNetは最先端の手法と比較して、競争力のある解析性能を得ることができる。
- 参考スコア(独自算出の注目度): 18.57227512333101
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human parsing is an essential branch of semantic segmentation, which is a
fine-grained semantic segmentation task to identify the constituent parts of
human. The challenge of human parsing is to extract effective semantic features
to resolve deformation and multi-scale variations. In this work, we proposed an
end-to-end model called C-DLinkNet based on LinkNet, which contains a new
module named Smooth Module to combine the multi-level features in Decoder part.
C-DLinkNet is capable of producing competitive parsing performance compared
with the state-of-the-art methods with smaller input sizes and no additional
information, i.e., achiving mIoU=53.05 on the validation set of LIP dataset.
- Abstract(参考訳): 人間のパーシングは意味的セグメンテーションの不可欠な分岐であり、人間の構成部分を特定するためのきめ細かいセグメンテーションタスクである。
人間解析の課題は、変形や多変種を解消するための効果的な意味的特徴を抽出することである。
本稿では,LinkNetをベースとしたC-DLinkNetと呼ばれるエンドツーエンドモデルを提案する。
C-DLinkNetは、LIPデータセットの検証セットでmIoU=53.05を得るという、入力サイズが小さく、追加情報がない最先端の手法と比較して、競争力のある解析性能を生み出すことができる。
関連論文リスト
- Generalizable Entity Grounding via Assistance of Large Language Model [77.07759442298666]
本稿では,長いキャプションから密接な視覚的実体を抽出する手法を提案する。
本研究では,意味代名詞の抽出に大規模なマルチモーダルモデル,エンティティレベルのセグメンテーションを生成するクラス-aセグメンテーションモデル,および各セグメンテーション名詞と対応するセグメンテーションマスクを関連付けるマルチモーダル特徴融合モジュールを利用する。
論文 参考訳(メタデータ) (2024-02-04T16:06:05Z) - Narrowing the semantic gaps in U-Net with learnable skip connections:
The case of medical image segmentation [12.812992773512871]
U-Netにおける3つのセグメンテーションギャップを解決するためにUDTransNetという新しいセグメンテーションフレームワークを提案する。
具体的には、チャネル関係と空間関係を捕捉するデュアルアテンショントランスフォーマー(DAT)モジュールと、DATトークンとデコーダ機能を効果的に接続するデコーダ誘導リカバリアアテンション(DRA)モジュールを提案する。
我々のUDTransNetは、異なる公開データセット上の最先端セグメンテーション手法よりも比較的少ないパラメータで、より高い評価スコアとより細かいセグメンテーション結果を生成する。
論文 参考訳(メタデータ) (2023-12-23T07:39:42Z) - Generalized Semantic Segmentation by Self-Supervised Source Domain
Projection and Multi-Level Contrastive Learning [79.0660895390689]
ソースドメインでトレーニングされたディープネットワークは、未確認のターゲットドメインデータでテストした場合、パフォーマンスが低下している。
汎用セマンティックセグメンテーションのためのドメイン・プロジェクションとコントラシブ・ラーニング(DPCL)手法を提案する。
論文 参考訳(メタデータ) (2023-03-03T13:07:14Z) - LENet: Lightweight And Efficient LiDAR Semantic Segmentation Using
Multi-Scale Convolution Attention [0.0]
本稿では,LDARに基づくセマンティックセマンティックセマンティクスのためのエンコーダデコーダ構造を持つLENetと呼ばれるプロジェクションベースのセマンティクスセマンティクスセマンティクスネットワークを提案する。
エンコーダは、特徴を捉えるために、様々な受信フィールドサイズを持つ新しいマルチスケール・コンボリューション・アテンション(MSCA)モジュールで構成されている。
提案手法は, 最先端のセマンティックセグメンテーション法と比較して, 軽量で, 効率的で, 堅牢であることを示す。
論文 参考訳(メタデータ) (2023-01-11T02:51:38Z) - Task-Adaptive Feature Transformer with Semantic Enrichment for Few-Shot
Segmentation [21.276981570672064]
わずかながらの学習により、機械はいくつかのラベル付きサンプルを使用して新しいクラスを分類できる。
本稿では,既存のセグメンテーションネットワーク上に,数発のセグメンテーションを行うための学習可能なモジュールを提案する。
PASCAL-$5i$とCOCO-$20i$データセットの実験では、追加されたモジュールが既存のセグメンテーションの機能を拡張することに成功した。
論文 参考訳(メタデータ) (2022-02-14T06:16:26Z) - CTNet: Context-based Tandem Network for Semantic Segmentation [77.4337867789772]
本研究では,空間コンテキスト情報とチャネルコンテキスト情報とを対話的に探索し,新しいコンテキストベースタンデムネットワーク(CTNet)を提案する。
セマンティックセグメンテーションのための学習表現の性能をさらに向上するため、2つのコンテキストモジュールの結果を適応的に統合する。
論文 参考訳(メタデータ) (2021-04-20T07:33:11Z) - EADNet: Efficient Asymmetric Dilated Network for Semantic Segmentation [8.449677920206817]
cityscapesデータセットにおける実験結果から,本提案手法は,軽量セマンティクスセグメンテーションネットワークにおいて,最小パラメータ数(わずか 0.35m)で67.1のセグメンテーションmiouを実現する。
論文 参考訳(メタデータ) (2021-03-16T08:46:57Z) - Differentiable Multi-Granularity Human Representation Learning for
Instance-Aware Human Semantic Parsing [131.97475877877608]
カテゴリーレベルの人間のセマンティックセグメンテーションとマルチパーソンポーズ推定を共同およびエンドツーエンドで学習するために,新たなボトムアップ方式を提案する。
さまざまな人間の粒度にわたって構造情報を利用する、コンパクトで効率的で強力なフレームワークです。
3つのインスタンス認識型ヒューマンデータセットの実験は、我々のモデルがより効率的な推論で他のボトムアップの代替案よりも優れていることを示している。
論文 参考訳(メタデータ) (2021-03-08T06:55:00Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Affinity Space Adaptation for Semantic Segmentation Across Domains [57.31113934195595]
本稿では,意味的セグメンテーションにおける教師なしドメイン適応(UDA)の問題に対処する。
ソースドメインとターゲットドメインが不変なセマンティック構造を持つという事実に触発され、ドメイン間におけるそのような不変性を活用することを提案する。
親和性空間適応戦略として,親和性空間の洗浄と親和性空間アライメントという2つの方法を開発した。
論文 参考訳(メタデータ) (2020-09-26T10:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。