論文の概要: DIRV: Dense Interaction Region Voting for End-to-End Human-Object
Interaction Detection
- arxiv url: http://arxiv.org/abs/2010.01005v2
- Date: Tue, 19 Jan 2021 16:48:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 01:51:12.414346
- Title: DIRV: Dense Interaction Region Voting for End-to-End Human-Object
Interaction Detection
- Title(参考訳): dirv: エンド・ツー・エンドのヒューマン・オブジェクト間インタラクション検出のための密接なインタラクション領域投票
- Authors: Hao-Shu Fang, Yichen Xie, Dian Shao, Cewu Lu
- Abstract要約: 本稿では,HOI問題に対するインタラクション領域という新しい概念に基づいて,新しい一段階HOI検出手法を提案する。
従来の手法とは異なり,本手法は人-物対ごとに異なるスケールにわたる密集した相互作用領域に焦点をあてる。
単一相互作用領域の検出欠陥を補うために,我々は新しい投票戦略を導入する。
- 参考スコア(独自算出の注目度): 53.40028068801092
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years, human-object interaction (HOI) detection has achieved
impressive advances. However, conventional two-stage methods are usually slow
in inference. On the other hand, existing one-stage methods mainly focus on the
union regions of interactions, which introduce unnecessary visual information
as disturbances to HOI detection. To tackle the problems above, we propose a
novel one-stage HOI detection approach DIRV in this paper, based on a new
concept called interaction region for the HOI problem. Unlike previous methods,
our approach concentrates on the densely sampled interaction regions across
different scales for each human-object pair, so as to capture the subtle visual
features that is most essential to the interaction. Moreover, in order to
compensate for the detection flaws of a single interaction region, we introduce
a novel voting strategy that makes full use of those overlapped interaction
regions in place of conventional Non-Maximal Suppression (NMS). Extensive
experiments on two popular benchmarks: V-COCO and HICO-DET show that our
approach outperforms existing state-of-the-arts by a large margin with the
highest inference speed and lightest network architecture. We achieved 56.1 mAP
on V-COCO without addtional input. Our code is publicly available at:
https://github.com/MVIG-SJTU/DIRV
- Abstract(参考訳): 近年,人-物間相互作用(HOI)の検出は目覚ましい進歩を遂げている。
しかし、従来の二段階法は通常推論が遅い。
一方,既存のワンステージ手法は,HOI検出の障害として不要な視覚情報を導入し,インタラクションの結合領域に重点を置いている。
本論文では,HOI問題に対するインタラクション領域という新しい概念に基づいて,新しい一段階HOI検出手法であるDIRVを提案する。
従来の手法と異なり,本手法では,人間と物体のペアごとに異なるスケールにわたる密集した相互作用領域に着目し,その相互作用に最も不可欠な微妙な視覚的特徴を捉える。
さらに、単一相互作用領域の検出欠陥を補うために、従来の非最大抑制(nms)に代えて、重複した相互作用領域を十分に活用する新たな投票戦略を提案する。
V-COCOとHICO-DETの2つの人気のあるベンチマーク実験により、我々のアプローチは既存の最先端技術よりも高い性能を示し、推論速度とネットワークアーキテクチャが最も軽い。
56.1mAPをV-COCOで追加入力なしで達成した。
私たちのコードは、https://github.com/MVIG-SJTU/DIRVで公開されています。
関連論文リスト
- UnionDet: Union-Level Detector Towards Real-Time Human-Object
Interaction Detection [35.2385914946471]
本稿では,新しい結合レベル検出器を用いたHOI検出のための一段階メタアーキテクチャを提案する。
ヒトと物体の相互作用の1段階検出器は、相互作用予測時間4x14xを著しく減少させる。
論文 参考訳(メタデータ) (2023-12-19T23:34:43Z) - Disentangled Interaction Representation for One-Stage Human-Object
Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。
最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。
従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文 参考訳(メタデータ) (2023-12-04T08:02:59Z) - Distance Matters in Human-Object Interaction Detection [22.3445174577181]
HOI検出における遠隔操作をよりよく扱うための新しい2段階手法を提案する。
我々の手法における重要な構成要素は、Far Near Distance Attentionモジュールである。
さらに,距離認識損失関数(Distance-Aware loss function)を考案した。
論文 参考訳(メタデータ) (2022-07-05T08:06:05Z) - Interactiveness Field in Human-Object Interactions [89.13149887013905]
画像中の物体が人間とペアリングした後、生成されたペアは、主に非対話的か、主に対話的かのいずれかである。
本研究では,対話型対と非対話型対の基底となる「相互作用性場」の濃度と差に基づく新しいエネルギー制約を提案する。
提案手法により,より高精度なペア検出が可能となり,HOI検出性能が大幅に向上する。
論文 参考訳(メタデータ) (2022-04-16T05:09:25Z) - ACP++: Action Co-occurrence Priors for Human-Object Interaction
Detection [102.9428507180728]
ヒューマン・オブジェクト・インタラクション(HOI)検出のタスクにおける一般的な問題は、多数のHOIクラスが少数のラベル付き例しか持たないことである。
我々は、人間と物体の相互作用の間に自然の相関関係と反相関が存在することを観察した。
我々は、これらの先行知識を学習し、特に稀なクラスにおいて、より効果的な訓練に活用する手法を提案する。
論文 参考訳(メタデータ) (2021-09-09T06:02:50Z) - Mining the Benefits of Two-stage and One-stage HOI Detection [26.919979955155664]
2段階の手法は、数年にわたって人-物体相互作用(HOI)の検出を支配してきた。
1段階の手法は、マルチタスク学習、すなわちオブジェクト検出と相互作用分類において適切なトレードオフを行うことが困難である。
本稿では,カスケード方式で人物体検出と相互作用分類を両立させる新しい一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-11T07:38:09Z) - Detecting Human-Object Interactions with Action Co-occurrence Priors [108.31956827512376]
人-物間相互作用(HOI)検出タスクにおける一般的な問題は、多数のHOIクラスが少数のラベル付き例しか持たないことである。
我々は、人間と物体の相互作用の間に自然の相関と反相関が存在することを観察した。
我々はこれらの先行知識を学習し、特に稀なクラスにおいてより効果的な訓練に活用する手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T02:47:45Z) - Learning Human-Object Interaction Detection using Interaction Points [140.0200950601552]
本研究では,人間と物体の相互作用を直接検出する新しい完全畳み込み手法を提案する。
我々のネットワークは相互作用点を予測し、その相互作用を直接ローカライズし、分類する。
V-COCOとHICO-DETの2つの人気のあるベンチマークで実験が行われる。
論文 参考訳(メタデータ) (2020-03-31T08:42:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。