論文の概要: Graph-Boosted Attentive Network for Semantic Body Parsing
- arxiv url: http://arxiv.org/abs/2407.05924v1
- Date: Mon, 8 Jul 2024 13:32:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 15:40:39.074289
- Title: Graph-Boosted Attentive Network for Semantic Body Parsing
- Title(参考訳): 意味的身体解析のためのグラフブースト注意ネットワーク
- Authors: Tinghuai Wang, Huiling Wang,
- Abstract要約: 本稿では,制約のない環境下で複数の人体を意味部分領域に分解する手法を提案する。
本稿では,特徴階層にまたがる新しい意味的・輪郭的注意機構を備えた畳み込みニューラルネットワークアーキテクチャを提案する。
提案手法は,Pascal Person-Partデータセットの最先端化を実現する。
- 参考スコア(独自算出の注目度): 1.4042211166197214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human body parsing remains a challenging problem in natural scenes due to multi-instance and inter-part semantic confusions as well as occlusions. This paper proposes a novel approach to decomposing multiple human bodies into semantic part regions in unconstrained environments. Specifically we propose a convolutional neural network (CNN) architecture which comprises of novel semantic and contour attention mechanisms across feature hierarchy to resolve the semantic ambiguities and boundary localization issues related to semantic body parsing. We further propose to encode estimated pose as higher-level contextual information which is combined with local semantic cues in a novel graphical model in a principled manner. In this proposed model, the lower-level semantic cues can be recursively updated by propagating higher-level contextual information from estimated pose and vice versa across the graph, so as to alleviate erroneous pose information and pixel level predictions. We further propose an optimization technique to efficiently derive the solutions. Our proposed method achieves the state-of-art results on the challenging Pascal Person-Part dataset.
- Abstract(参考訳): 人体解析は、複数のインスタンスや部分間のセマンティックな混同や隠蔽によって、自然界では難しい問題である。
本稿では,制約のない環境下で複数の人体を意味部分領域に分解する手法を提案する。
具体的には、セマンティックボディー解析に関連するセマンティックなあいまいさと境界ローカライゼーションの問題を解決するために、特徴階層にまたがる新しいセマンティックアテンションと輪郭アテンション機構からなる畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
さらに,新しいグラフィカルモデルを用いて,局所的な意味的手がかりと組み合わせた高レベルな文脈情報として推定されたポーズを符号化する手法を提案する。
提案モデルでは,推定されたポーズから高レベルな文脈情報を伝播させることにより,低レベルなセマンティックキューを再帰的に更新し,誤ったポーズ情報や画素レベルの予測を緩和する。
さらに,解を効率的に導出する最適化手法を提案する。
提案手法は,Pascal Person-Partデータセットの最先端化を実現する。
関連論文リスト
- Semantic Loss Functions for Neuro-Symbolic Structured Prediction [74.18322585177832]
このような構造に関する知識を象徴的に定義した意味的損失をトレーニングに注入する。
記号の配置に非依存であり、それによって表現される意味論にのみ依存する。
識別型ニューラルモデルと生成型ニューラルモデルの両方と組み合わせることができる。
論文 参考訳(メタデータ) (2024-05-12T22:18:25Z) - IDRNet: Intervention-Driven Relation Network for Semantic Segmentation [34.09179171102469]
同時進行の視覚パターンは、画素関係モデリングが密接な予測タスクを促進することを示唆している。
印象的な結果にもかかわらず、既存のパラダイムは、しばしば不適切または効果的な文脈情報集約に悩まされる。
我々は,textbfIntervention-textbfDriven textbfRelation textbfNetworkを提案する。
論文 参考訳(メタデータ) (2023-10-16T18:37:33Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - A Unified Architecture of Semantic Segmentation and Hierarchical
Generative Adversarial Networks for Expression Manipulation [52.911307452212256]
セマンティックセグメンテーションと階層的GANの統一アーキテクチャを開発する。
我々のフレームワークのユニークな利点は、将来的なセマンティックセグメンテーションネットワーク条件を生成モデルに渡すことである。
我々は,AffectNetとRaFDの2つの難解な表情翻訳ベンチマークとセマンティックセグメンテーションベンチマークであるCelebAMask-HQについて評価を行った。
論文 参考訳(メタデータ) (2021-12-08T22:06:31Z) - Local Permutation Equivariance For Graph Neural Networks [2.208242292882514]
そこで我々は,局所置換同変グラフニューラルネットワークという新しい手法を開発した。
ローカルノード近傍で動作するグラフニューラルネットワークを構築するためのフレームワークを提供する。
提案手法を,グラフベンチマークの分類タスクの範囲で実験的に検証する。
論文 参考訳(メタデータ) (2021-11-23T13:10:34Z) - Thousand to One: Semantic Prior Modeling for Conceptual Coding [26.41657489930382]
画像圧縮を極端に少ないものにするための概念符号化方式を提案する。
意味セグメンテーションマップを構造的指導として深層セグメンテーションの事前抽出を行う。
空間独立意味論のチャネル間相関をさらに活用するために, チャネル間エントロピーモデルを提案する。
論文 参考訳(メタデータ) (2021-03-12T08:02:07Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Distributional semantic modeling: a revised technique to train term/word
vector space models applying the ontology-related approach [36.248702416150124]
ニューラルネットワークを用いた分散項表現(あるいは項埋め込み)学習による分布意味モデリングのための新しい手法を設計する。
Vec2graphは、動的かつインタラクティブなグラフとして単語埋め込み(私たちの場合の長期埋め込み)を視覚化するためのPythonライブラリである。
論文 参考訳(メタデータ) (2020-03-06T18:27:39Z) - Focus on Semantic Consistency for Cross-domain Crowd Understanding [34.560447389853614]
いくつかのドメイン適応アルゴリズムは、合成データでモデルをトレーニングすることでそれを解放しようとする。
その結果,背景領域における推定誤差が既存手法の性能を阻害していることが判明した。
本稿では,ドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2020-02-20T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。