論文の概要: RR-Net: Injecting Interactive Semantics in Human-Object Interaction
Detection
- arxiv url: http://arxiv.org/abs/2104.15015v1
- Date: Fri, 30 Apr 2021 14:03:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:37:00.563125
- Title: RR-Net: Injecting Interactive Semantics in Human-Object Interaction
Detection
- Title(参考訳): RR-Net:人間と物体の相互作用検出における対話的意味論の注入
- Authors: Dongming Yang, Yuexian Zou, Can Zhang, Meng Cao, Jie Chen
- Abstract要約: 最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。
まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。
上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。
RR-Net)
- 参考スコア(独自算出の注目度): 40.65483058890176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-Object Interaction (HOI) detection devotes to learn how humans interact
with surrounding objects. Latest end-to-end HOI detectors are short of relation
reasoning, which leads to inability to learn HOI-specific interactive semantics
for predictions. In this paper, we therefore propose novel relation reasoning
for HOI detection. We first present a progressive Relation-aware Frame, which
brings a new structure and parameter sharing pattern for interaction inference.
Upon the frame, an Interaction Intensifier Module and a Correlation Parsing
Module are carefully designed, where: a) interactive semantics from humans can
be exploited and passed to objects to intensify interactions, b) interactive
correlations among humans, objects and interactions are integrated to promote
predictions. Based on modules above, we construct an end-to-end trainable
framework named Relation Reasoning Network (abbr. RR-Net). Extensive
experiments show that our proposed RR-Net sets a new state-of-the-art on both
V-COCO and HICO-DET benchmarks and improves the baseline about 5.5% and 9.8%
relatively, validating that this first effort in exploring relation reasoning
and integrating interactive semantics has brought obvious improvement for
end-to-end HOI detection.
- Abstract(参考訳): 人間-物体相互作用(Human-Object Interaction、HOI)は、人間が周囲の物体とどのように相互作用するかを学ぶこと。
最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。
そこで本稿では,hoi検出のための新しい関係推論を提案する。
まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。
a) 人間の対話的セマンティクスを活用してオブジェクトに渡してインタラクションを強化する,b) 人,オブジェクト,インタラクション間の対話的相関を統合して予測を促進する,というように,インタラクション拡張モジュールと相関解析モジュールを慎重に設計する。
上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。
RR-Net)。
大規模な実験により、提案したRR-NetはV-COCOとHICO-DETのベンチマークに新たな最先端を設定し、ベースラインを約5.5%と9.8%の相対的に改善した。
関連論文リスト
- SSL-Interactions: Pretext Tasks for Interactive Trajectory Prediction [4.286256266868156]
トラジェクティブ予測のためのインタラクションモデリングを強化するために,プリテキストタスクを提案するSSL-Interactionsを提案する。
エージェントインタラクションの様々な側面をカプセル化する4つの対話対応プレテキストタスクを導入する。
また,データセットからインタラクション重大シナリオをキュレートする手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:43:40Z) - Disentangled Interaction Representation for One-Stage Human-Object
Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。
最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。
従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文 参考訳(メタデータ) (2023-12-04T08:02:59Z) - Parallel Reasoning Network for Human-Object Interaction Detection [53.422076419484945]
並列推論ネットワーク(PR-Net)というトランスフォーマーに基づく新しい手法を提案する。
PR-Netは、インスタンスレベルのローカライゼーションと関係レベルの理解のための2つの独立した予測器を構築する。
我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
論文 参考訳(メタデータ) (2023-01-09T17:00:34Z) - DIDER: Discovering Interpretable Dynamically Evolving Relations [14.69985920418015]
本稿では,内在的解釈可能性を備えた汎用的なエンドツーエンドインタラクションモデリングフレームワークであるDIDER,Discovering Interpretable Dynamically Evolving Relationsを紹介する。
合成と実世界の両方のデータセット上でDIDERを評価する。
論文 参考訳(メタデータ) (2022-08-22T20:55:56Z) - Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。
本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。
この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文 参考訳(メタデータ) (2021-03-10T10:40:33Z) - A Graph-based Interactive Reasoning for Human-Object Interaction
Detection [71.50535113279551]
本稿では,HOIを推論するインタラクティブグラフ(Interactive Graph, in-Graph)という,グラフに基づくインタラクティブ推論モデルを提案する。
In-GraphNet と呼ばれる HOI を検出するための新しいフレームワークを構築した。
私たちのフレームワークはエンドツーエンドのトレーニングが可能で、人間のポーズのような高価なアノテーションはありません。
論文 参考訳(メタデータ) (2020-07-14T09:29:03Z) - Learning Human-Object Interaction Detection using Interaction Points [140.0200950601552]
本研究では,人間と物体の相互作用を直接検出する新しい完全畳み込み手法を提案する。
我々のネットワークは相互作用点を予測し、その相互作用を直接ローカライズし、分類する。
V-COCOとHICO-DETの2つの人気のあるベンチマークで実験が行われる。
論文 参考訳(メタデータ) (2020-03-31T08:42:06Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。