論文の概要: QAHOI: Query-Based Anchors for Human-Object Interaction Detection
- arxiv url: http://arxiv.org/abs/2112.08647v1
- Date: Thu, 16 Dec 2021 05:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-18 03:23:10.876991
- Title: QAHOI: Query-Based Anchors for Human-Object Interaction Detection
- Title(参考訳): QAHOI:人間と物体のインタラクション検出のためのクエリベースのアンカー
- Authors: Junwen Chen and Keiji Yanai
- Abstract要約: 1段階のアプローチは、高い効率性のため、このタスクの新たなトレンドになっている。
本稿では、クエリベースのアンカーを用いてHOIインスタンスのすべての要素を予測するトランスフォーマーベースのQAHOIを提案する。
我々は, 強力なバックボーンがQAHOIの精度を大幅に向上させ, トランスフォーマーベースのバックボーンを用いたQAHOIは, HICO-DETベンチマークにおいて, 最新の最先端手法よりも高い性能を示した。
- 参考スコア(独自算出の注目度): 29.548384966666013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human-object interaction (HOI) detection as a downstream of object detection
tasks requires localizing pairs of humans and objects and extracting the
semantic relationships between humans and objects from an image. Recently,
one-stage approaches have become a new trend for this task due to their high
efficiency. However, these approaches focus on detecting possible interaction
points or filtering human-object pairs, ignoring the variability in the
location and size of different objects at spatial scales. To address this
problem, we propose a transformer-based method, QAHOI (Query-Based Anchors for
Human-Object Interaction detection), which leverages a multi-scale architecture
to extract features from different spatial scales and uses query-based anchors
to predict all the elements of an HOI instance. We further investigate that a
powerful backbone significantly increases accuracy for QAHOI, and QAHOI with a
transformer-based backbone outperforms recent state-of-the-art methods by large
margins on the HICO-DET benchmark. The source code is available at
$\href{https://github.com/cjw2021/QAHOI}{\text{this https URL}}$.
- Abstract(参考訳): オブジェクト検出タスクの下流としてのヒューマン・オブジェクト・インタラクション(hoi)検出には、人間とオブジェクトのペアをローカライズし、画像から人間とオブジェクトの間のセマンティックな関係を抽出する必要がある。
近年, 高い効率性のため, ワンステージアプローチが新たなトレンドとなっている。
しかし、これらのアプローチは、可能なインタラクションポイントの検出や、人間とオブジェクトのペアをフィルタリングすることに焦点を当て、空間規模での異なるオブジェクトの位置やサイズの変化を無視する。
この問題を解決するために,マルチスケールアーキテクチャを活用し,異なる空間スケールから特徴を抽出し,クエリベースのアンカーを用いてHOIインスタンスのすべての要素を予測する,トランスフォーマーベースのQAHOI(Query-based Anchors for Human-Object Interaction Detection)を提案する。
さらに、強力なバックボーンはQAHOIの精度を大幅に向上させ、トランスフォーマーベースのバックボーンを用いたQAHOIはHICO-DETベンチマークにおいて、最新の最先端手法よりも高い性能を示した。
ソースコードは$\href{https://github.com/cjw2021/qahoi}{\text{this https url}}$で入手できる。
関連論文リスト
- Hierarchical Graph Interaction Transformer with Dynamic Token Clustering for Camouflaged Object Detection [57.883265488038134]
本稿では,HGINetと呼ばれる階層的なグラフ相互作用ネットワークを提案する。
このネットワークは、階層的トークン化機能間の効果的なグラフ相互作用を通じて、知覚不能なオブジェクトを発見することができる。
本実験は,既存の最先端手法と比較して,HGINetの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-08-27T12:53:25Z) - UnionDet: Union-Level Detector Towards Real-Time Human-Object
Interaction Detection [35.2385914946471]
本稿では,新しい結合レベル検出器を用いたHOI検出のための一段階メタアーキテクチャを提案する。
ヒトと物体の相互作用の1段階検出器は、相互作用予測時間4x14xを著しく減少させる。
論文 参考訳(メタデータ) (2023-12-19T23:34:43Z) - HODN: Disentangling Human-Object Feature for HOI Detection [51.48164941412871]
本稿では,Human and Object Disentangling Network (HODN) を提案し,Human-Object Interaction (HOI) の関係を明示的にモデル化する。
インタラクションに人間的特徴がより寄与していることを考慮し,インタラクションデコーダが人間中心の領域に焦点を当てていることを確認するためのヒューマンガイドリンク手法を提案する。
提案手法は,V-COCOとHICO-Det Linkingデータセットの競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-20T04:12:50Z) - FGAHOI: Fine-Grained Anchors for Human-Object Interaction Detection [4.534713782093219]
上記の問題を緩和するために、新しいエンドツーエンドトランスフォーマーベースフレームワーク(FGAHOI)を提案する。
FGAHOIは、マルチスケールサンプリング(MSS)、階層空間認識マージ(HSAM)、タスク認識マージ機構(TAM)の3つの専用コンポーネントから構成される。
論文 参考訳(メタデータ) (2023-01-08T03:53:50Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z) - Human Object Interaction Detection using Two-Direction Spatial
Enhancement and Exclusive Object Prior [28.99655101929647]
Human-Object Interaction (HOI) 検出は、画像中の人間とオブジェクトの視覚的関係を検出することを目的とする。
非インタラクティブな人-物対は、容易に誤分類され、アクションとして分類される。
本論文では, 空間的制約を2方向から強化する空間拡張手法を提案する。
論文 参考訳(メタデータ) (2021-05-07T07:18:27Z) - HOTR: End-to-End Human-Object Interaction Detection with Transformers [26.664864824357164]
そこで本研究では, HOTRが提唱する, 画像からヒト, オブジェクト, 相互作用> トリプレットの集合を直接予測する新しいフレームワークを提案する。
提案アルゴリズムは,2つのHOI検出ベンチマークにおいて,オブジェクト検出後1ms以下の推論時間で最新の性能を実現する。
論文 参考訳(メタデータ) (2021-04-28T10:10:29Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Learning Human-Object Interaction Detection using Interaction Points [140.0200950601552]
本研究では,人間と物体の相互作用を直接検出する新しい完全畳み込み手法を提案する。
我々のネットワークは相互作用点を予測し、その相互作用を直接ローカライズし、分類する。
V-COCOとHICO-DETの2つの人気のあるベンチマークで実験が行われる。
論文 参考訳(メタデータ) (2020-03-31T08:42:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。