論文の概要: Relational Context Learning for Human-Object Interaction Detection
- arxiv url: http://arxiv.org/abs/2304.04997v1
- Date: Tue, 11 Apr 2023 06:01:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 16:10:32.018470
- Title: Relational Context Learning for Human-Object Interaction Detection
- Title(参考訳): 人間-オブジェクト間インタラクション検出のための関係コンテキスト学習
- Authors: Sanghyun Kim, Deunsol Jung, Minsu Cho
- Abstract要約: 本稿では、3つのデコーダブランチ間でリッチなコンテキスト交換を行う多重関係ネットワーク(MUREN)を提案する。
提案手法は,HOI インスタンス発見のための包括的関係コンテキストを学習する。
- 参考スコア(独自算出の注目度): 34.319471023763384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent state-of-the-art methods for HOI detection typically build on
transformer architectures with two decoder branches, one for human-object pair
detection and the other for interaction classification. Such disentangled
transformers, however, may suffer from insufficient context exchange between
the branches and lead to a lack of context information for relational
reasoning, which is critical in discovering HOI instances. In this work, we
propose the multiplex relation network (MUREN) that performs rich context
exchange between three decoder branches using unary, pairwise, and ternary
relations of human, object, and interaction tokens. The proposed method learns
comprehensive relational contexts for discovering HOI instances, achieving
state-of-the-art performance on two standard benchmarks for HOI detection,
HICO-DET and V-COCO.
- Abstract(参考訳): 最近のHOI検出の最先端手法は、典型的には2つのデコーダ分岐を持つトランスフォーマーアーキテクチャ上に構築されている。
しかし、このような非絡み合ったトランスフォーマーは、分岐間のコンテキスト交換が不十分で、関係推論のためのコンテキスト情報が欠如し、hoiインスタンスの発見に不可欠である。
本研究では,人間,オブジェクト,インタラクショントークンのユニタリ,ペアワイズ,三元関係を用いて,3つのデコーダブランチ間のリッチなコンテキスト交換を行うマルチプレックス関係ネットワーク(muren)を提案する。
提案手法は,HOI検出のための標準ベンチマークであるHICO-DETとV-COCOの2つを用いて,HOIインスタンスの検索と最先端性能を実現する。
関連論文リスト
- Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer [78.35816158511523]
単段階の感情認識手法として,DSCT(Decoupled Subject-Context Transformer)を用いる。
広範に使われている文脈認識型感情認識データセットであるCAER-SとEMOTICの単段階フレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-04-26T07:30:32Z) - Neural-Logic Human-Object Interaction Detection [67.4993347702353]
本稿では,ニューラルロジック推論を利用した新しいHOI検出器であるL OGIC HOIと,実体間の相互作用を推測するTransformerを提案する。
具体的には,バニラトランスフォーマーの自己保持機構を改変し,人間,行動,対象>三重項を推論し,新たな相互作用を構成する。
我々はこれらの2つの特性を一階述語論理で定式化し、それらを連続空間に基底にして、我々のアプローチの学習過程を制約し、性能とゼロショットの一般化能力を向上させる。
論文 参考訳(メタデータ) (2023-11-16T11:47:53Z) - Parallel Reasoning Network for Human-Object Interaction Detection [53.422076419484945]
並列推論ネットワーク(PR-Net)というトランスフォーマーに基づく新しい手法を提案する。
PR-Netは、インスタンスレベルのローカライゼーションと関係レベルの理解のための2つの独立した予測器を構築する。
我々のPR-NetはHICO-DETとV-COCOベンチマークで競合する結果を得た。
論文 参考訳(メタデータ) (2023-01-09T17:00:34Z) - Knowledge Guided Bidirectional Attention Network for Human-Object
Interaction Detection [3.0915392100355192]
HOIにおけるボトムアップ構文解析戦略の独立的利用は直感に反し、注意の拡散につながる可能性があると論じる。
HOIに新たな知識誘導型トップダウンアテンションを導入し、関係解析を「ルックアンドサーチ」プロセスとしてモデル化することを提案する。
一つのエンコーダ-デコーダモデルでボトムアップとトップダウンの注意を統一することで、プロセスを実装します。
論文 参考訳(メタデータ) (2022-07-16T16:42:49Z) - Human-Object Interaction Detection via Disentangled Transformer [63.46358684341105]
本稿では,2つのサブタスクの学習を容易にするために,エンコーダとデコーダの両方をアンタングル化するDisentangled Transformerを提案する。
提案手法は,2つの公開HOIベンチマークにおいて,従来よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2022-04-20T08:15:04Z) - GEN-VLKT: Simplify Association and Enhance Interaction Understanding for
HOI Detection [17.92210977820113]
本稿では,2分岐パイプラインをポストマッチングなしで実現するためのガイド埋め込みネットワーク(GEN)を提案する。
協会にとって、以前の2枝の手法は複雑でコストのかかるポストマッチングに悩まされる。
相互作用理解のために、従来の手法は長い尾の分布とゼロショット発見に悩まされていた。
論文 参考訳(メタデータ) (2022-03-26T01:04:13Z) - RR-Net: Injecting Interactive Semantics in Human-Object Interaction
Detection [40.65483058890176]
最新のエンドツーエンドHOI検出器は関係推論に欠けており、予測のためにHOI固有の対話的セマンティクスを学習できない。
まず、インタラクション推論のための新しい構造とパラメータ共有パターンをもたらす、プログレッシブな関係認識フレームを提案する。
上記のモジュールに基づいて、Relation Reasoning Network (abbr) というエンドツーエンドのトレーニング可能なフレームワークを構築します。
RR-Net)
論文 参考訳(メタデータ) (2021-04-30T14:03:10Z) - DCR-Net: A Deep Co-Interactive Relation Network for Joint Dialog Act
Recognition and Sentiment Classification [77.59549450705384]
ダイアログシステムでは、ダイアログアクト認識と感情分類は2つの相関タスクである。
既存のシステムのほとんどは、それらを別々のタスクとして扱うか、単に2つのタスクを一緒にモデル化するだけです。
本稿では,2つのタスク間の相互作用をモデル化するディープ・コ・インタラクティブ・リレーショナル・ネットワーク(DCR-Net)を提案する。
論文 参考訳(メタデータ) (2020-08-16T14:13:32Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。