論文の概要: PPDM: Parallel Point Detection and Matching for Real-time Human-Object
Interaction Detection
- arxiv url: http://arxiv.org/abs/1912.12898v3
- Date: Wed, 25 Mar 2020 12:29:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 02:42:52.729277
- Title: PPDM: Parallel Point Detection and Matching for Real-time Human-Object
Interaction Detection
- Title(参考訳): PPDM:リアルタイムヒューマンオブジェクトインタラクション検出のための並列点検出とマッチング
- Authors: Yue Liao, Si Liu, Fei Wang, Yanjie Chen, Chen Qian, Jiashi Feng
- Abstract要約: 本稿では,Human-Object Interaction (HOI) の単一段階検出手法を提案する。
これは、初めてのリアルタイムHOI検出方法である。
- 参考スコア(独自算出の注目度): 85.75935399090379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a single-stage Human-Object Interaction (HOI) detection method
that has outperformed all existing methods on HICO-DET dataset at 37 fps on a
single Titan XP GPU. It is the first real-time HOI detection method.
Conventional HOI detection methods are composed of two stages, i.e.,
human-object proposals generation, and proposals classification. Their
effectiveness and efficiency are limited by the sequential and separate
architecture. In this paper, we propose a Parallel Point Detection and Matching
(PPDM) HOI detection framework. In PPDM, an HOI is defined as a point triplet <
human point, interaction point, object point>. Human and object points are the
center of the detection boxes, and the interaction point is the midpoint of the
human and object points. PPDM contains two parallel branches, namely point
detection branch and point matching branch. The point detection branch predicts
three points. Simultaneously, the point matching branch predicts two
displacements from the interaction point to its corresponding human and object
points. The human point and the object point originated from the same
interaction point are considered as matched pairs. In our novel parallel
architecture, the interaction points implicitly provide context and
regularization for human and object detection. The isolated detection boxes are
unlikely to form meaning HOI triplets are suppressed, which increases the
precision of HOI detection. Moreover, the matching between human and object
detection boxes is only applied around limited numbers of filtered candidate
interaction points, which saves much computational cost. Additionally, we build
a new application-oriented database named HOI-A, which severs as a good
supplement to the existing datasets. The source code and the dataset will be
made publicly available to facilitate the development of HOI detection.
- Abstract(参考訳): 我々は,Human-Object Interaction (HOI) を1つのTitan XP GPU上で37fpsでHICO-DETデータセット上の既存手法より優れる一段階検出法を提案する。
これは初めてのリアルタイムHOI検出方法である。
従来のHOI検出方法は、人-対象の提案生成と提案分類の2段階からなる。
その有効性と効率性は、シーケンシャルかつ独立したアーキテクチャによって制限される。
本稿では,Parallel Point Detection and Matching (PPDM) HOI 検出フレームワークを提案する。
PPDMでは、HOIは点三重項<人間点,相互作用点,オブジェクト点>として定義される。
人間とオブジェクトポイントは検出ボックスの中心であり、相互作用ポイントは人間とオブジェクトポイントの中間点である。
PPDMは2つの並列分岐、すなわち点検出分岐と点マッチング分岐を含む。
点検出分岐は3点を予測する。
同時に、点マッチング分岐は、相互作用点から対応する人間および対象点への2つの変位を予測する。
同じ相互作用点に由来するヒューマンポイントとオブジェクトポイントは一致するペアと見なされる。
我々の新しい並列アーキテクチャでは、相互作用ポイントは暗黙的に人間と物体の検出のコンテキストと規則化を提供する。
分離された検出ボックスはHOI三重項の抑制の意味を形成できないため、HOI検出の精度が向上する。
さらに、人間とオブジェクト検出ボックスのマッチングは、限られた数のフィルタされた候補インタラクションポイントでのみ適用され、計算コストが大幅に削減される。
さらに、既存のデータセットを補完するものとして、HOI-Aという新しいアプリケーション指向データベースを構築しました。
ソースコードとデータセットは、HOI検出の開発を容易にするために公開されます。
関連論文リスト
- Disentangled Pre-training for Human-Object Interaction Detection [22.653500926559833]
本稿では,DP-HOI検出のための非交互事前学習法を提案する。
DP-HOIは、オブジェクト検出とアクション認識データセットを使用して、検出およびインタラクションデコーダ層を事前トレーニングする。
これは、様々な稀なカテゴリにおける既存のHOI検出モデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2024-04-02T08:21:16Z) - HODN: Disentangling Human-Object Feature for HOI Detection [51.48164941412871]
本稿では,Human and Object Disentangling Network (HODN) を提案し,Human-Object Interaction (HOI) の関係を明示的にモデル化する。
インタラクションに人間的特徴がより寄与していることを考慮し,インタラクションデコーダが人間中心の領域に焦点を当てていることを確認するためのヒューマンガイドリンク手法を提案する。
提案手法は,V-COCOとHICO-Det Linkingデータセットの競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-20T04:12:50Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - 6D Object Pose Estimation using Keypoints and Part Affinity Fields [24.126513851779936]
RGB画像からの6Dオブジェクトのポーズ推定のタスクは、自律型サービスロボットが現実世界と対話できるための重要な要件である。
既知物体の6自由度変換と配向を推定するための2段階パイプラインを提案する。
論文 参考訳(メタデータ) (2021-07-05T14:41:19Z) - HOTR: End-to-End Human-Object Interaction Detection with Transformers [26.664864824357164]
そこで本研究では, HOTRが提唱する, 画像からヒト, オブジェクト, 相互作用> トリプレットの集合を直接予測する新しいフレームワークを提案する。
提案アルゴリズムは,2つのHOI検出ベンチマークにおいて,オブジェクト検出後1ms以下の推論時間で最新の性能を実現する。
論文 参考訳(メタデータ) (2021-04-28T10:10:29Z) - Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。
本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。
この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文 参考訳(メタデータ) (2021-03-10T10:40:33Z) - A Graph-based Interactive Reasoning for Human-Object Interaction
Detection [71.50535113279551]
本稿では,HOIを推論するインタラクティブグラフ(Interactive Graph, in-Graph)という,グラフに基づくインタラクティブ推論モデルを提案する。
In-GraphNet と呼ばれる HOI を検出するための新しいフレームワークを構築した。
私たちのフレームワークはエンドツーエンドのトレーニングが可能で、人間のポーズのような高価なアノテーションはありません。
論文 参考訳(メタデータ) (2020-07-14T09:29:03Z) - Learning Human-Object Interaction Detection using Interaction Points [140.0200950601552]
本研究では,人間と物体の相互作用を直接検出する新しい完全畳み込み手法を提案する。
我々のネットワークは相互作用点を予測し、その相互作用を直接ローカライズし、分類する。
V-COCOとHICO-DETの2つの人気のあるベンチマークで実験が行われる。
論文 参考訳(メタデータ) (2020-03-31T08:42:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。