論文の概要: I^2R-Net: Intra- and Inter-Human Relation Network for Multi-Person Pose
Estimation
- arxiv url: http://arxiv.org/abs/2206.10892v1
- Date: Wed, 22 Jun 2022 07:44:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-24 02:15:43.851162
- Title: I^2R-Net: Intra- and Inter-Human Relation Network for Multi-Person Pose
Estimation
- Title(参考訳): i^2r-net : 多人数ポーズ推定のための人間間関係ネットワーク
- Authors: Yiwei Ding, Wenjin Deng, Yinglin Zheng, Pengfei Liu, Meihong Wang,
Xuan Cheng, Jianmin Bao, Dong Chen, Ming Zeng
- Abstract要約: マルチパーソン・ポーズ推定のためのイントラ・イントラ・ヒューマン・リレーショナル・ネットワーク(I2R-Net)を提案する。
まず、Human内リレーショナルモジュールは1人で動作し、Human内依存関係をキャプチャすることを目的としている。
第2に、Human間関係モジュールは複数のインスタンス間の関係を考慮し、Human間相互作用のキャプチャに重点を置いている。
- 参考スコア(独自算出の注目度): 30.204633647947293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present the Intra- and Inter-Human Relation Networks
(I^2R-Net) for Multi-Person Pose Estimation. It involves two basic modules.
First, the Intra-Human Relation Module operates on a single person and aims to
capture Intra-Human dependencies. Second, the Inter-Human Relation Module
considers the relation between multiple instances and focuses on capturing
Inter-Human interactions. The Inter-Human Relation Module can be designed very
lightweight by reducing the resolution of feature map, yet learn useful
relation information to significantly boost the performance of the Intra-Human
Relation Module. Even without bells and whistles, our method can compete or
outperform current competition winners. We conduct extensive experiments on
COCO, CrowdPose, and OCHuman datasets. The results demonstrate that the
proposed model surpasses all the state-of-the-art methods. Concretely, the
proposed method achieves 77.4% AP on CrowPose dataset and 67.8% AP on OCHuman
dataset respectively, outperforming existing methods by a large margin.
Additionally, the ablation study and visualization analysis also prove the
effectiveness of our model.
- Abstract(参考訳): 本稿では,多人数ポーズ推定のための人間間関係ネットワーク(i^2r-net)を提案する。
基本モジュールは2つある。
まず、Human内リレーショナルモジュールは1人で動作し、Human内依存関係をキャプチャすることを目的としている。
第2に、Human間関係モジュールは複数のインスタンス間の関係を考慮し、Human間相互作用のキャプチャに重点を置いている。
関数間関係モジュールは特徴マップの解像度を小さくすることで非常に軽量に設計できるが、Human内関係モジュールの性能を大幅に向上させるために有用な関係情報を学習することができる。
ベルやホイッスルがなくても、我々の方法は現在の競争勝者を競ったり、上回ったりすることができる。
我々はCOCO、CrowdPose、OCHumanデータセットに関する広範な実験を行っている。
その結果,提案モデルがすべての最先端手法を超越していることが示唆された。
具体的には,CrowPoseデータセットでは77.4%のAP,OCHumanデータセットでは67.8%のAPを達成した。
また, アブレーション研究と可視化分析により, モデルの有効性が証明された。
関連論文リスト
- Learning Mutual Excitation for Hand-to-Hand and Human-to-Human
Interaction Recognition [22.538114033191313]
相互励起グラフ畳み込み層を積み重ねた相互励起グラフ畳み込みネットワーク(me-GCN)を提案する。
Me-GCは各レイヤとグラフ畳み込み操作の各ステージで相互情報を学習する。
提案するme-GCは,最先端GCN法およびTransformer法より優れている。
論文 参考訳(メタデータ) (2024-02-04T10:00:00Z) - RelVAE: Generative Pretraining for few-shot Visual Relationship
Detection [2.2230760534775915]
本研究は,注釈付き関係を必要としない数発述語分類のための最初の事前学習手法を提案する。
VG200とVRDのデータセットについて,数発のトレーニング分割を構築し,定量的な実験を行った。
論文 参考訳(メタデータ) (2023-11-27T19:08:08Z) - I2SRM: Intra- and Inter-Sample Relationship Modeling for Multimodal
Information Extraction [10.684005956288347]
本稿では,本課題に対するサンプル内およびサンプル間関係モデリング(I2SRM)手法を提案する。
提案手法は,Twitter-2015で77.12%のF1スコア,Twitter-2017で88.40%のF1スコア,MNREで84.12%のF1スコアと競合する結果を得た。
論文 参考訳(メタデータ) (2023-10-10T05:50:25Z) - Global Relation Modeling and Refinement for Bottom-Up Human Pose
Estimation [4.24515544235173]
ボトムアップヒトポーズ推定のための畳み込みニューラルネットワークを提案する。
我々のモデルは、地域によって異なる粒度に焦点を合わせることができる。
COCO と CrowdPose のデータセットで得られた結果は,多人数ポーズ推定の効率的なフレームワークであることを実証している。
論文 参考訳(メタデータ) (2023-03-27T02:54:08Z) - Inverse Reinforcement Learning for Text Summarization [52.765898203824975]
本稿では,抽象的な要約モデルを学習するための効果的なパラダイムとして,逆強化学習(IRL)を導入する。
異なる領域におけるデータセット間の実験結果は、MLEおよびRLベースラインに対する要約のための提案したIRLモデルの優位性を示す。
論文 参考訳(メタデータ) (2022-12-19T23:45:05Z) - Learning Multiscale Correlations for Human Motion Prediction [10.335804615372629]
本研究では、人体成分間の相関を捕捉する新しいマルチスケールグラフ畳み込みネットワーク(MGCN)を提案する。
ヒューマンモーション予測のための2つの標準ベンチマークデータセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-03-19T07:58:16Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - DRG: Dual Relation Graph for Human-Object Interaction Detection [65.50707710054141]
人-物間相互作用(HOI)検出の課題に対処する。
既存の方法は、人間と物体の対の相互作用を独立に認識するか、複雑な外観に基づく共同推論を行う。
本稿では,抽象的空間意味表現を活用して,各対象対を記述し,二重関係グラフを用いてシーンの文脈情報を集約する。
論文 参考訳(メタデータ) (2020-08-26T17:59:40Z) - HMOR: Hierarchical Multi-Person Ordinal Relations for Monocular
Multi-Person 3D Pose Estimation [54.23770284299979]
本稿では, 階層型多人数常連関係(HMOR)を新たに導入する。
HMORは相互作用情報を階層的に深さと角度の順序関係として符号化する。
統合トップダウンモデルは、学習プロセスにおけるこれらの順序関係を活用するように設計されている。
提案手法は, 公開されている多人数の3Dポーズデータセットにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-08-01T07:53:27Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。