論文の概要: Consistency-Aware Graph Network for Human Interaction Understanding
- arxiv url: http://arxiv.org/abs/2011.10250v3
- Date: Tue, 23 Mar 2021 15:32:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 05:57:27.132785
- Title: Consistency-Aware Graph Network for Human Interaction Understanding
- Title(参考訳): ヒューマンインタラクション理解のための一貫性を意識したグラフネットワーク
- Authors: Zhenhua Wang, Jiajun Meng, Dongyan Guo, Jianhua Zhang, Javen Qinfeng
Shi, Shengyong Chen
- Abstract要約: 本稿では,グラフネットワークの代表的な能力と,HIUタスクの促進を目的とした一貫性を考慮した推論を組み合わせた,一貫性を考慮したグラフネットワークを提案する。
我々のネットワークは,画像の特徴を抽出するバックボーンCNN,参加者間の3階対話関係を学習する因子グラフネットワーク,ラベリングとグループ化を強制する一貫性を考慮した推論モジュールの3つのコンポーネントから構成される。
- 参考スコア(独自算出の注目度): 17.416289346143948
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compared with the progress made on human activity classification, much less
success has been achieved on human interaction understanding (HIU). Apart from
the latter task is much more challenging, the main cause is that recent
approaches learn human interactive relations via shallow graphical models,
which is inadequate to model complicated human interactions. In this paper, we
propose a consistency-aware graph network, which combines the representative
ability of graph network and the consistency-aware reasoning to facilitate the
HIU task. Our network consists of three components, a backbone CNN to extract
image features, a factor graph network to learn third-order interactive
relations among participants, and a consistency-aware reasoning module to
enforce labeling and grouping consistencies. Our key observation is that the
consistency-aware-reasoning bias for HIU can be embedded into an energy
function, minimizing which delivers consistent predictions. An efficient
mean-field inference algorithm is proposed, such that all modules of our
network could be trained jointly in an end-to-end manner. Experimental results
show that our approach achieves leading performance on three benchmarks.
- Abstract(参考訳): ヒトの行動分類の進歩と比較すると、ヒトの相互作用理解(HIU)において成功ははるかに少ない。
後者のタスクは、はるかに難しいが、近年のアプローチでは、人間の相互作用をモデル化するのに不十分な浅いグラフィカルモデルを通して人間の対話関係を学習している。
本稿では,hiuタスクを容易にするために,グラフネットワークの代表的能力と一貫性を意識した推論を組み合わせる,一貫性を意識したグラフネットワークを提案する。
我々のネットワークは,画像の特徴を抽出するバックボーンCNN,参加者間の3階対話関係を学習する因子グラフネットワーク,ラベリングとグループ化を強制する一貫性を考慮した推論モジュールからなる。
我々の重要な観察は、HIUの整合性認識バイアスをエネルギー関数に埋め込むことができ、一貫した予測を最小化できるということである。
ネットワークの全てのモジュールをエンドツーエンドで協調的に訓練できるように,効率的な平均場推論アルゴリズムを提案する。
実験の結果,本手法は3つのベンチマークで有意な性能を得た。
関連論文リスト
- Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - Unified Framework with Consistency across Modalities for Human Activity Recognition [14.639249548669756]
本稿では,ロバストな映像に基づく人間行動認識のための包括的枠組みを提案する。
主な貢献はComputerと呼ばれる新しいクエリマシンの導入である。
提案手法は,最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-04T02:25:10Z) - Signed Graph Neural Ordinary Differential Equation for Modeling
Continuous-time Dynamics [13.912268915939656]
グラフニューラルネットワークを通常の微分方程式と統合する一般的なアプローチは、有望な性能を示している。
符号付きグラフニューラル常微分方程式は,符号付き情報の誤キャプチャの限界に十分対処する。
提案したソリューションは、柔軟性と効率性の両方を誇っている。
論文 参考訳(メタデータ) (2023-12-18T13:45:33Z) - Personalized Decentralized Multi-Task Learning Over Dynamic
Communication Graphs [59.96266198512243]
本稿では,正と負の相関関係を持つタスクに対する分散・フェデレーション学習アルゴリズムを提案する。
本アルゴリズムでは,タスク間の相関関係を自動的に計算し,コミュニケーショングラフを動的に調整して相互に有益なタスクを接続し,互いに悪影響を及ぼす可能性のあるタスクを分離する。
合成ガウスデータセットと大規模セレブ属性(CelebA)データセットについて実験を行った。
論文 参考訳(メタデータ) (2022-12-21T18:58:24Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Soft Hierarchical Graph Recurrent Networks for Many-Agent Partially
Observable Environments [9.067091068256747]
本稿では,階層型グラフ再帰ネットワーク(HGRN)と呼ばれる新しいネットワーク構造を提案する。
以上の技術に基づいて,Soft-HGRNと呼ばれる値に基づくMADRLアルゴリズムと,SAC-HRGNというアクタクリティカルな変種を提案する。
論文 参考訳(メタデータ) (2021-09-05T09:51:25Z) - Graph-Based Neural Network Models with Multiple Self-Supervised
Auxiliary Tasks [79.28094304325116]
グラフ畳み込みネットワークは、構造化されたデータポイント間の関係をキャプチャするための最も有望なアプローチである。
マルチタスク方式でグラフベースニューラルネットワークモデルを学習するための3つの新しい自己教師付き補助タスクを提案する。
論文 参考訳(メタデータ) (2020-11-14T11:09:51Z) - ConsNet: Learning Consistency Graph for Zero-Shot Human-Object
Interaction Detection [101.56529337489417]
画像中のHuman, Action, Object>の形のHOIインスタンスを検出・認識することを目的としたHuman-Object Interaction (HOI) Detectionの問題点を考察する。
我々は、オブジェクト、アクション、インタラクション間の多レベルコンパレンシーは、稀な、あるいは以前には見られなかったHOIのセマンティック表現を生成するための強力な手がかりであると主張している。
提案モデルでは,人-対象のペアの視覚的特徴とHOIラベルの単語埋め込みを入力とし,それらを視覚-意味的関節埋め込み空間にマッピングし,類似度を計測して検出結果を得る。
論文 参考訳(メタデータ) (2020-08-14T09:11:18Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z) - End-To-End Graph-based Deep Semi-Supervised Learning [7.151859287072378]
グラフの品質は、グラフノード、エッジ、類似度測定(エッジウェイト)の3つの重要な要素によって共同で決定される
エンドツーエンドの学習方式で3つの要素を同時に最適化する,グラフに基づく半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-02-23T12:32:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。