Fugu-MT 論文翻訳(概要): Learning Compositional Neural Information Fusion for Human Parsing

論文の概要: Learning Compositional Neural Information Fusion for Human Parsing

arxiv url: http://arxiv.org/abs/2001.06804v1
Date: Sun, 19 Jan 2020 10:35:14 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-08 12:39:31.274421
Title: Learning Compositional Neural Information Fusion for Human Parsing
Title（参考訳）: 人間の解析のための学習構成型ニューラル情報融合
Authors: Wenguan Wang, Zhijie Zhang, Siyuan Qi, Jianbing Shen, Yanwei Pang, and Ling Shao
Abstract要約: 我々はこのアプローチを神経情報融合フレームワークとして定式化する。我々のモデルは階層上の3つの推論プロセスから情報を収集する。モデル全体がエンドツーエンドで識別可能であり、情報フローと構造を明示的にモデル化する。
参考スコア（独自算出の注目度）: 181.48380078517525
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This work proposes to combine neural networks with the compositional hierarchy of human bodies for efficient and complete human parsing. We formulate the approach as a neural information fusion framework. Our model assembles the information from three inference processes over the hierarchy: direct inference (directly predicting each part of a human body using image information), bottom-up inference (assembling knowledge from constituent parts), and top-down inference (leveraging context from parent nodes). The bottom-up and top-down inferences explicitly model the compositional and decompositional relations in human bodies, respectively. In addition, the fusion of multi-source information is conditioned on the inputs, i.e., by estimating and considering the confidence of the sources. The whole model is end-to-end differentiable, explicitly modeling information flows and structures. Our approach is extensively evaluated on four popular datasets, outperforming the state-of-the-arts in all cases, with a fast processing speed of 23fps. Our code and results have been released to help ease future research in this direction.
Abstract（参考訳）: この研究は、ニューラルネットワークと人体の構成階層を組み合わせることで、効率的で完全な人間の解析を行うことを提案する。我々はこのアプローチを神経情報融合フレームワークとして定式化する。本モデルでは,階層上の3つの推論プロセスから情報を収集する。直接推論(画像情報を用いて人体の各部分を直接予測する),ボトムアップ推論(構成部品から知識を組み立てる),トップダウン推論(親ノードからコンテキストを推定する)である。ボトムアップとトップダウンの推論は、それぞれ人体の構成関係と分解関係をモデル化する。さらに、複数のソース情報の融合を入力、すなわちソースの信頼度を推定し、考慮することで条件付けする。モデル全体がエンドツーエンドで微分可能で、情報の流れや構造を明示的にモデル化します。提案手法は4つの一般的なデータセットに対して広範に評価され,高速な処理速度を23fpsで実現した。この方向への今後の研究を容易にするため、コードと結果がリリースされました。

関連論文リスト

Interpretable Image Classification via Non-parametric Part Prototype Learning [14.390730075612248]
解釈可能な意思決定プロセスで画像を分類することは、コンピュータビジョンにおける長年の問題である。近年、自己説明可能なニューラルネットワークのアプローチとして、プロトタイプのPart Networksが注目を集めている。本稿では,各クラスに対して意味的に固有のオブジェクト部品の集合を学習する,部分的解釈可能な画像分類のためのフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-13T10:46:53Z)
Human-Object Interaction Detection Collaborated with Large Relation-driven Diffusion Models [65.82564074712836]
テキストと画像の拡散モデルに光を流す新しいHOI検出器であるDIFfusionHOIを紹介する。まず、埋め込み空間における人間と物体の関係パターンの表現をインバージョンベースで学習する戦略を考案する。これらの学習された関係埋め込みはテキストのプロンプトとして機能し、スタイア拡散モデルが特定の相互作用を記述する画像を生成する。
論文参考訳（メタデータ） (2024-10-26T12:00:33Z)
Bridging Neural and Symbolic Representations with Transitional Dictionary Learning [4.326886488307076]
本稿では,記号的知識を暗黙的に学習できる新しいトランジショナル辞書学習(TDL)フレームワークを提案する。本稿では,期待最大化法(EM)アルゴリズムで学習した辞書を用いて,入力を視覚部分へ分解するゲーム理論拡散モデルを提案する。 3つの抽象的な合成視覚オブジェクトデータセットを用いて実験を行った。
論文参考訳（メタデータ） (2023-08-03T19:29:35Z)
Evaluating alignment between humans and neural network representations in image-based learning tasks [5.657101730705275]
トレーニング済みの860ドルのニューラルネットワークモデルの表現が、人間の学習軌跡にどのようにマッピングされているかテストしました。トレーニングデータセットのサイズは人間の選択に沿った中核的な決定要因であるのに対し、マルチモーダルデータ(テキストと画像)による対照的なトレーニングは、人間の一般化を予測するために現在公開されているモデルの一般的な特徴であることがわかった。結論として、事前訓練されたニューラルネットワークは、タスク間で伝達可能な認知の基本的な側面を捉えているように見えるため、認知モデルのための表現を抽出するのに役立つ。
論文参考訳（メタデータ） (2023-06-15T08:18:29Z)
Deep Learning for Human Parsing: A Survey [54.812353922568995]
本研究では,人間の意味解析の先駆的な研究の幅広い範囲を網羅する,最先端の人間の構文解析手法の解析を行う。 1) 構造駆動型アーキテクチャは,人体の異なる部分と固有の階層構造を生かし,(2) グラフベースのネットワークは,効率的で完全な人体分析を実現するためにグローバルな情報を捉え,(3) コンテキスト認識ネットワークは,対応するクラスのピクセルを特徴付けるために,すべてのピクセルにわたって有用なコンテキストを探索し,(4) LSTMベースの手法は,短距離と長距離空間の依存関係を結合して,豊富な局所的・グローバルなコンテキストをうまく活用することができる。
論文参考訳（メタデータ） (2023-01-29T10:54:56Z)
COAP: Compositional Articulated Occupancy of People [28.234772596912162]
人体を明瞭に表現する新しい神経暗黙表現法を提案する。我々は、ニューラルネットワークの占有度を学習するために、部分認識エンコーダデコーダアーキテクチャを採用する。提案手法は, 効率と精度の両面において, 既存の解よりも優れていた。
論文参考訳（メタデータ） (2022-04-13T06:02:20Z)
Learning to Segment Human Body Parts with Synthetically Trained Deep Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文参考訳（メタデータ） (2021-02-02T12:26:50Z)
HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。 HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文参考訳（メタデータ） (2020-08-01T07:53:27Z)
Generating Hierarchical Explanations on Text Classification via Feature Interaction Detection [21.02924712220406]
特徴的相互作用を検出することによって階層的な説明を構築する。このような説明は、単語とフレーズが階層の異なるレベルでどのように結合されるかを視覚化する。実験は、モデルに忠実であり、人間に解釈可能な説明を提供する上で、提案手法の有効性を示す。
論文参考訳（メタデータ） (2020-04-04T20:56:37Z)
Hierarchical Human Parsing with Typed Part-Relation Reasoning [179.64978033077222]
このタスクでは、人体構造をモデル化する方法が中心的なテーマである。深層グラフネットワークの表現能力と階層的人間構造を同時に活用することを模索する。
論文参考訳（メタデータ） (2020-03-10T16:45:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。