論文の概要: Parallel Reasoning Network for Human-Object Interaction Detection
- arxiv url: http://arxiv.org/abs/2301.03510v1
- Date: Mon, 9 Jan 2023 17:00:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 17:16:29.711956
- Title: Parallel Reasoning Network for Human-Object Interaction Detection
- Title(参考訳): ヒューマンオブジェクトインタラクション検出のための並列推論ネットワーク
- Authors: Huan Peng, Fenggang Liu, Yangguang Li, Bin Huang, Jing Shao, Nong
Sang, Changxin Gao
- Abstract要約: 並列推論ネットワーク(PR-Net)というトランスフォーマーに基づく新しい手法を提案する。
PR-Netは、インスタンスレベルのローカライゼーションと関係レベルの理解のための2つの独立した予測器を構築する。
我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
- 参考スコア(独自算出の注目度): 53.422076419484945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-Object Interaction (HOI) detection aims to learn how human interacts
with surrounding objects. Previous HOI detection frameworks simultaneously
detect human, objects and their corresponding interactions by using a
predictor. Using only one shared predictor cannot differentiate the attentive
field of instance-level prediction and relation-level prediction. To solve this
problem, we propose a new transformer-based method named Parallel Reasoning
Network(PR-Net), which constructs two independent predictors for instance-level
localization and relation-level understanding. The former predictor
concentrates on instance-level localization by perceiving instances' extremity
regions. The latter broadens the scope of relation region to reach a better
relation-level semantic understanding. Extensive experiments and analysis on
HICO-DET benchmark exhibit that our PR-Net effectively alleviated this problem.
Our PR-Net has achieved competitive results on HICO-DET and V-COCO benchmarks.
- Abstract(参考訳): 人間と物体の相互作用(hoi)検出は、人間が周囲の物体とどう相互作用するかを学ぶことを目的としている。
従来のHOI検出フレームワークは、予測器を用いて人、物、およびそれに対応する相互作用を同時に検出する。
1つの共有予測器だけでは、インスタンスレベルの予測と関係レベルの予測の注意領域を区別できない。
そこで本研究では,並列推論ネットワーク(pr-net)と呼ばれる,インスタンスレベルの局所化と関係レベル理解のための2つの独立した予測器を構築するトランスフォーマティブベース手法を提案する。
前者はインスタンスの極端領域を知覚することでインスタンスレベルのローカライゼーションに集中する。
後者は関係領域の範囲を広げ、関係レベルのセマンティック理解を改善する。
HICO-DETベンチマークの大規模な実験と分析により、我々のPR-Netはこの問題を効果的に軽減した。
我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
関連論文リスト
- Qualitative Prediction of Multi-Agent Spatial Interactions [5.742409080817885]
我々は,密集シーンにおけるマルチエージェントインタラクションをモデル化し,予測するための3つの新しいアプローチを提示し,ベンチマークする。
提案手法は、個々の相互作用を予測する静的および動的コンテキストを考慮したものである。
彼らはインプット・アンド・タイムアテンション・メカニズムを利用し、中・長期の地平線でテストされる。
論文 参考訳(メタデータ) (2023-06-30T18:08:25Z) - Knowledge Guided Bidirectional Attention Network for Human-Object
Interaction Detection [3.0915392100355192]
HOIにおけるボトムアップ構文解析戦略の独立的利用は直感に反し、注意の拡散につながる可能性があると論じる。
HOIに新たな知識誘導型トップダウンアテンションを導入し、関係解析を「ルックアンドサーチ」プロセスとしてモデル化することを提案する。
一つのエンコーダ-デコーダモデルでボトムアップとトップダウンの注意を統一することで、プロセスを実装します。
論文 参考訳(メタデータ) (2022-07-16T16:42:49Z) - ACP++: Action Co-occurrence Priors for Human-Object Interaction
Detection [102.9428507180728]
ヒューマン・オブジェクト・インタラクション(HOI)検出のタスクにおける一般的な問題は、多数のHOIクラスが少数のラベル付き例しか持たないことである。
我々は、人間と物体の相互作用の間に自然の相関関係と反相関が存在することを観察した。
我々は、これらの先行知識を学習し、特に稀なクラスにおいて、より効果的な訓練に活用する手法を提案する。
論文 参考訳(メタデータ) (2021-09-09T06:02:50Z) - RR-Net: Injecting Interactive Semantics in Human-Object Interaction
Detection [40.65483058890176]
最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。
まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。
上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。
RR-Net)
論文 参考訳(メタデータ) (2021-04-30T14:03:10Z) - Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。
本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。
この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文 参考訳(メタデータ) (2021-03-10T10:40:33Z) - Detecting Human-Object Interactions with Action Co-occurrence Priors [108.31956827512376]
人-物間相互作用(HOI)検出タスクにおける一般的な問題は、多数のHOIクラスが少数のラベル付き例しか持たないことである。
我々は、人間と物体の相互作用の間に自然の相関と反相関が存在することを観察した。
我々はこれらの先行知識を学習し、特に稀なクラスにおいてより効果的な訓練に活用する手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T02:47:45Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z) - Learning Human-Object Interaction Detection using Interaction Points [140.0200950601552]
本研究では,人間と物体の相互作用を直接検出する新しい完全畳み込み手法を提案する。
我々のネットワークは相互作用点を予測し、その相互作用を直接ローカライズし、分類する。
V-COCOとHICO-DETの2つの人気のあるベンチマークで実験が行われる。
論文 参考訳(メタデータ) (2020-03-31T08:42:06Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。