論文の概要: AMIL: Adversarial Multi Instance Learning for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2003.08002v1
- Date: Wed, 18 Mar 2020 01:22:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 10:18:21.579964
- Title: AMIL: Adversarial Multi Instance Learning for Human Pose Estimation
- Title(参考訳): AMIL:人文推定のための対話型マルチインスタンス学習
- Authors: Pourya Shamsolmoali, Masoumeh Zareapoor, Huiyu Zhou, Jie Yang
- Abstract要約: 本稿では,ネットワークのトレーニングにおいて,事前を慎重に考慮する構造対応ネットワークを提案する。
我々は2つの残留多重インスタンス学習モデル(MIL)を設計する学習モデルとして、生成逆ネットワークを提案する。
プールをベースとした逆数残差マルチインスタンスニューラルネットワークを2つのデータセットで検証した。
- 参考スコア(独自算出の注目度): 24.175298058941515
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Human pose estimation has an important impact on a wide range of applications
from human-computer interface to surveillance and content-based video
retrieval. For human pose estimation, joint obstructions and overlapping upon
human bodies result in departed pose estimation. To address these problems, by
integrating priors of the structure of human bodies, we present a novel
structure-aware network to discreetly consider such priors during the training
of the network. Typically, learning such constraints is a challenging task.
Instead, we propose generative adversarial networks as our learning model in
which we design two residual multiple instance learning (MIL) models with the
identical architecture, one is used as the generator and the other one is used
as the discriminator. The discriminator task is to distinguish the actual poses
from the fake ones. If the pose generator generates the results that the
discriminator is not able to distinguish from the real ones, the model has
successfully learnt the priors. In the proposed model, the discriminator
differentiates the ground-truth heatmaps from the generated ones, and later the
adversarial loss back-propagates to the generator. Such procedure assists the
generator to learn reasonable body configurations and is proved to be
advantageous to improve the pose estimation accuracy. Meanwhile, we propose a
novel function for MIL. It is an adjustable structure for both instance
selection and modeling to appropriately pass the information between instances
in a single bag. In the proposed residual MIL neural network, the pooling
action adequately updates the instance contribution to its bag. The proposed
adversarial residual multi-instance neural network that is based on pooling has
been validated on two datasets for the human pose estimation task and
successfully outperforms the other state-of-arts models.
- Abstract(参考訳): 人間のポーズ推定は、ヒューマンコンピュータインタフェースから監視やコンテンツに基づくビデオ検索まで幅広い応用に重要な影響を与える。
人間のポーズ推定では、関節の障害や人体の重なりが、離脱したポーズ推定に繋がる。
これらの問題に対処するために,人体の構造の優先順位を統合することにより,ネットワークのトレーニング中にその優先順位を慎重に検討する新しい構造認識ネットワークを提案する。
通常、そのような制約を学ぶことは難しい課題です。
そこで本研究では,同一のアーキテクチャを持つ2つの残差複数インスタンス学習モデル(mil)を設計し,一方を生成器として,もう一方を判別器として使用する学習モデルとして生成型逆ネットワークを提案する。
判別作業は、実際のポーズと偽のポーズを区別することである。
ポーズ生成器が、判別器が実際のものと区別できない結果を生成すると、モデルが事前学習に成功する。
提案モデルでは, 地中断熱マップと生成熱マップを区別し, その後, 逆方向の損失が生成体に逆伝搬する。
このような手順は、発電機が合理的な身体構成を学ぶのを補助し、ポーズ推定精度を向上させるのに有利であることが証明される。
一方,我々はmilの新しい機能を提案する。
インスタンス選択とモデリングの両方を行うための調整可能な構造で、ひとつのバッグ内のインスタンス間で情報を適切に渡すことができる。
提案された残留MILニューラルネットワークでは、プールアクションがバッグへのインスタンスコントリビューションを適切に更新する。
ヒトのポーズ推定タスクの2つのデータセットにおいて、プールに基づく逆数残差マルチインスタンスニューラルネットワークが検証され、他の最先端モデルよりもうまく性能が向上した。
関連論文リスト
- Towards Robust and Realistic Human Pose Estimation via WiFi Signals [85.60557095666934]
WiFiベースの人間のポーズ推定は、離散的で微妙なWiFi信号を人間の骨格にブリッジする難しいタスクである。
本論文は,本問題を再検討し,(1)ドメイン間ギャップ,(2)ソース・ターゲット領域のポーズ分布の顕著な変化,(2)骨格のポーズが歪んだトポロジーを示す構造的フィデリティギャップ,の2つの重要な問題を明らかにする。
本稿では,タスクをDT-Poseと呼ばれる新しい2段階のフレームワークに書き換えることで,これらのギャップを埋める:ドメイン一貫性表現学習とトポロジ制約ポスデコーディング。
論文 参考訳(メタデータ) (2025-01-16T09:38:22Z) - Unsupervised Domain Adaptation for Occlusion Resilient Human Pose Estimation [23.0839810713682]
排除は人間のポーズ推定アルゴリズムにとって重要な課題である。
OR-POSE: Occlusion Resilient Human POSE Estimationのための教師なしドメイン適応を提案する。
論文 参考訳(メタデータ) (2025-01-06T05:30:37Z) - Closely Interactive Human Reconstruction with Proxemics and Physics-Guided Adaption [64.07607726562841]
既存の人間再建アプローチは主に、正確なポーズの回復や侵入を避けることに焦点を当てている。
本研究では,モノクロ映像から密に対話的な人間を再構築する作業に取り組む。
本稿では,視覚情報の欠如を補うために,確率的行動や物理からの知識を活用することを提案する。
論文 参考訳(メタデータ) (2024-04-17T11:55:45Z) - MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - Building a Winning Team: Selecting Source Model Ensembles using a
Submodular Transferability Estimation Approach [20.86345962679122]
公開されている事前訓練されたモデルの目標タスクへの転送可能性の推定は、伝達学習タスクにとって重要な場所となっている。
本稿では, モデルアンサンブルの下流タスクへの転送可能性を評価するために, 最適なtranSportベースのsuBmOdular tRaNsferability Metrics(OSBORN)を提案する。
論文 参考訳(メタデータ) (2023-09-05T17:57:31Z) - Population-Based Evolutionary Gaming for Unsupervised Person
Re-identification [26.279581599246224]
教師なしの人物の再識別は、個々のニューラルネットワークの自己改善を通じて大きな成功を収めた。
我々は,多種多様なニューラルネットワークの集団が選択,再現,突然変異,集団相互学習を通じて同時に訓練される,人口ベースの進化型ゲーム(PEG)フレームワークを開発する。
PEGは、個人の再識別のための新しい最先端の精度を生み出し、教師なし学習のための集団ベースのネットワーク協調トレーニングの大きな可能性を示している。
論文 参考訳(メタデータ) (2023-06-08T14:33:41Z) - Diversity vs. Recognizability: Human-like generalization in one-shot
generative models [5.964436882344729]
サンプル認識可能性と多様性の2つの軸に沿った1ショット生成モデルを評価するための新しい枠組みを提案する。
まず、GANのようなモデルとVAEのようなモデルが多様性認識性空間の反対側にあることを示す。
対照的に、非絡み合いは、認識可能性の最大化に使用できるパラボラ曲線に沿ってモデルを輸送する。
論文 参考訳(メタデータ) (2022-05-20T13:17:08Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。