Fugu-MT 論文翻訳(概要): RR-Net: Injecting Interactive Semantics in Human-Object Interaction Detection

論文の概要: RR-Net: Injecting Interactive Semantics in Human-Object Interaction Detection

arxiv url: http://arxiv.org/abs/2104.15015v1
Date: Fri, 30 Apr 2021 14:03:10 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-03 13:37:00.563125
Title: RR-Net: Injecting Interactive Semantics in Human-Object Interaction Detection
Title（参考訳）: RR-Net:人間と物体の相互作用検出における対話的意味論の注入
Authors: Dongming Yang, Yuexian Zou, Can Zhang, Meng Cao, Jie Chen
Abstract要約: 最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。 RR-Net)
参考スコア（独自算出の注目度）: 40.65483058890176
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Human-Object Interaction (HOI) detection devotes to learn how humans interact with surrounding objects. Latest end-to-end HOI detectors are short of relation reasoning, which leads to inability to learn HOI-specific interactive semantics for predictions. In this paper, we therefore propose novel relation reasoning for HOI detection. We first present a progressive Relation-aware Frame, which brings a new structure and parameter sharing pattern for interaction inference. Upon the frame, an Interaction Intensifier Module and a Correlation Parsing Module are carefully designed, where: a) interactive semantics from humans can be exploited and passed to objects to intensify interactions, b) interactive correlations among humans, objects and interactions are integrated to promote predictions. Based on modules above, we construct an end-to-end trainable framework named Relation Reasoning Network (abbr. RR-Net). Extensive experiments show that our proposed RR-Net sets a new state-of-the-art on both V-COCO and HICO-DET benchmarks and improves the baseline about 5.5% and 9.8% relatively, validating that this first effort in exploring relation reasoning and integrating interactive semantics has brought obvious improvement for end-to-end HOI detection.
Abstract（参考訳）: 人間-物体相互作用(Human-Object Interaction、HOI)は、人間が周囲の物体とどのように相互作用するかを学ぶこと。最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。そこで本稿では,hoi検出のための新しい関係推論を提案する。まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。 a) 人間の対話的セマンティクスを活用してオブジェクトに渡してインタラクションを強化する,b) 人,オブジェクト,インタラクション間の対話的相関を統合して予測を促進する,というように,インタラクション拡張モジュールと相関解析モジュールを慎重に設計する。上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。 RR-Net)。大規模な実験により、提案したRR-NetはV-COCOとHICO-DETのベンチマークに新たな最先端を設定し、ベースラインを約5.5%と9.8%の相対的に改善した。

関連論文リスト

Learning Human-Object Interaction as Groups [52.28258599873394]
GroupHOIは、幾何学的近接性および意味的類似性の観点から文脈情報を伝播するフレームワークである。これは、より困難な非言語間相互作用検出タスクにおいて、主要なパフォーマンスを示す。
論文参考訳（メタデータ） (2025-10-21T07:25:10Z)
DQEN: Dual Query Enhancement Network for DETR-based HOI Detection [19.742290580421322]
人間と物体の相互作用(Human-Object Interaction, HOI)の検出は、人間と物体のペアをローカライズし、その相互作用を認識することに焦点を当てる。 DETRベースのHOIモデルでは、HOIを正確に検出するために明確な意味を持つクエリが不可欠である。本稿では、オブジェクトおよびインタラクションクエリを強化するために、DQEN(Dual Query Enhancement Network)を提案する。
論文参考訳（メタデータ） (2025-08-26T10:11:08Z)
SSL-Interactions: Pretext Tasks for Interactive Trajectory Prediction [4.286256266868156]
トラジェクティブ予測のためのインタラクションモデリングを強化するために,プリテキストタスクを提案するSSL-Interactionsを提案する。エージェントインタラクションの様々な側面をカプセル化する4つの対話対応プレテキストタスクを導入する。また,データセットからインタラクション重大シナリオをキュレートする手法を提案する。
論文参考訳（メタデータ） (2024-01-15T14:43:40Z)
Disentangled Interaction Representation for One-Stage Human-Object Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文参考訳（メタデータ） (2023-12-04T08:02:59Z)
Parallel Reasoning Network for Human-Object Interaction Detection [53.422076419484945]
並列推論ネットワーク(PR-Net)というトランスフォーマーに基づく新しい手法を提案する。 PR-Netは、インスタンスレベルのローカライゼーションと関係レベルの理解のための2つの独立した予測器を構築する。我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
論文参考訳（メタデータ） (2023-01-09T17:00:34Z)
DIDER: Discovering Interpretable Dynamically Evolving Relations [14.69985920418015]
本稿では,内在的解釈可能性を備えた汎用的なエンドツーエンドインタラクションモデリングフレームワークであるDIDER,Discovering Interpretable Dynamically Evolving Relationsを紹介する。合成と実世界の両方のデータセット上でDIDERを評価する。
論文参考訳（メタデータ） (2022-08-22T20:55:56Z)
Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文参考訳（メタデータ） (2021-03-10T10:40:33Z)
A Graph-based Interactive Reasoning for Human-Object Interaction Detection [71.50535113279551]
本稿では,HOIを推論するインタラクティブグラフ(Interactive Graph, in-Graph)という,グラフに基づくインタラクティブ推論モデルを提案する。 In-GraphNet と呼ばれる HOI を検出するための新しいフレームワークを構築した。私たちのフレームワークはエンドツーエンドのトレーニングが可能で、人間のポーズのような高価なアノテーションはありません。
論文参考訳（メタデータ） (2020-07-14T09:29:03Z)
Learning Human-Object Interaction Detection using Interaction Points [140.0200950601552]
本研究では,人間と物体の相互作用を直接検出する新しい完全畳み込み手法を提案する。我々のネットワークは相互作用点を予測し、その相互作用を直接ローカライズし、分類する。 V-COCOとHICO-DETの2つの人気のあるベンチマークで実験が行われる。
論文参考訳（メタデータ） (2020-03-31T08:42:06Z)
Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文参考訳（メタデータ） (2020-03-09T17:05:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。