論文の概要: Spatially Conditioned Graphs for Detecting Human-Object Interactions
- arxiv url: http://arxiv.org/abs/2012.06060v2
- Date: Wed, 31 Mar 2021 05:34:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 03:14:49.581920
- Title: Spatially Conditioned Graphs for Detecting Human-Object Interactions
- Title(参考訳): 人間と物体の相互作用検出のための空間条件付きグラフ
- Authors: Frederic Z. Zhang, Dylan Campbell, Stephen Gould
- Abstract要約: グラフィカルニューラルネットワークを用いて画像中の物体間相互作用を検出する問題に対処する。
対のノード間のメッセージを空間的関係で条件付けし,同じノードの近傍に異なるメッセージを送ることを提案する。
本手法はHICO-DETで31.33%,V-COCOで54.2%のmAPを達成し,微調整検出で最先端のmAPを実現した。
- 参考スコア(独自算出の注目度): 41.44769642537572
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of detecting human-object interactions in images using
graphical neural networks. Unlike conventional methods, where nodes send scaled
but otherwise identical messages to each of their neighbours, we propose to
condition messages between pairs of nodes on their spatial relationships,
resulting in different messages going to neighbours of the same node. To this
end, we explore various ways of applying spatial conditioning under a
multi-branch structure. Through extensive experimentation we demonstrate the
advantages of spatial conditioning for the computation of the adjacency
structure, messages and the refined graph features. In particular, we
empirically show that as the quality of the bounding boxes increases, their
coarse appearance features contribute relatively less to the disambiguation of
interactions compared to the spatial information. Our method achieves an mAP of
31.33% on HICO-DET and 54.2% on V-COCO, significantly outperforming
state-of-the-art on fine-tuned detections.
- Abstract(参考訳): グラフィカルニューラルネットワークを用いて画像中の物体間相互作用を検出する問題に対処する。
従来の手法とは異なり、各ノードがそれぞれの近隣ノードに同じメッセージを送信している場合、各ノード間のメッセージの空間的関係を条件として、同一ノードの隣ノードに異なるメッセージを送信することを提案する。
そこで本稿では,マルチブランチ構造下での空間条件の適用方法について検討する。
広範な実験を通じて,隣接構造,メッセージ,洗練されたグラフ特徴の計算における空間的条件付けの利点を実証する。
特に,境界ボックスの品質が向上するにつれて,その粗い外観特徴が空間情報に比べて相互作用の曖昧さに比較的寄与することが実証的に示される。
本手法はHICO-DETで31.33%,V-COCOで54.2%のmAPを達成し,微調整検出で最先端のmAPを実現する。
関連論文リスト
- A Skeleton-aware Graph Convolutional Network for Human-Object
Interaction Detection [14.900704382194013]
そこで我々は,SGCN4HOIという人-物間相互作用検出のためのスケルトン対応グラフ畳み込みネットワークを提案する。
我々のネットワークは、人間のキーポイントとオブジェクトキーポイントの間の空間的接続を利用して、グラフの畳み込みによるきめ細かい構造的相互作用を捉えます。
このような幾何学的特徴と視覚的特徴と、人間と物体のペアから得られる空間的構成特徴を融合させる。
論文 参考訳(メタデータ) (2022-07-11T15:20:18Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Comparing object recognition in humans and deep convolutional neural
networks -- An eye tracking study [7.222232547612573]
深部畳み込みニューラルネットワーク(DCNN)と腹側視覚経路は、大きなアーキテクチャと機能的な類似点を共有している。
人間の観察者(N = 45)と3人のフィードフォワードDCNNの比較を,視線追跡とサリエンシマップを用いて示す。
vNetと呼ばれる生物学的に妥当な受容野サイズを持つDCNNは、標準的なResNetアーキテクチャと対照的な人間の視聴行動と高い一致を示している。
論文 参考訳(メタデータ) (2021-07-30T23:32:05Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z) - Distance-aware Molecule Graph Attention Network for Drug-Target Binding
Affinity Prediction [54.93890176891602]
薬物標的結合親和性予測に適したDiStance-aware Molecule graph Attention Network (S-MAN)を提案する。
そこで,我々はまず,構築したポケットリガンドグラフに位相構造と空間位置情報を統合する位置符号化機構を提案する。
また,エッジレベルアグリゲーションとノードレベルアグリゲーションを有するエッジノード階層的アグリゲーション構造を提案する。
論文 参考訳(メタデータ) (2020-12-17T17:44:01Z) - DRG: Dual Relation Graph for Human-Object Interaction Detection [65.50707710054141]
人-物間相互作用(HOI)検出の課題に対処する。
既存の方法は、人間と物体の対の相互作用を独立に認識するか、複雑な外観に基づく共同推論を行う。
本稿では,抽象的空間意味表現を活用して,各対象対を記述し,二重関係グラフを用いてシーンの文脈情報を集約する。
論文 参考訳(メタデータ) (2020-08-26T17:59:40Z) - A Graph-based Interactive Reasoning for Human-Object Interaction
Detection [71.50535113279551]
本稿では,HOIを推論するインタラクティブグラフ(Interactive Graph, in-Graph)という,グラフに基づくインタラクティブ推論モデルを提案する。
In-GraphNet と呼ばれる HOI を検出するための新しいフレームワークを構築した。
私たちのフレームワークはエンドツーエンドのトレーニングが可能で、人間のポーズのような高価なアノテーションはありません。
論文 参考訳(メタデータ) (2020-07-14T09:29:03Z) - Decoupled Spatial-Temporal Attention Network for Skeleton-Based Action
Recognition [46.836815779215456]
本稿では,骨格に基づく行動認識のための空間的注意ネットワーク(DSTA-Net)を提案する。
注意ブロックの構築には,空間的時間的注意分離,非結合位置符号化,空間的大域正規化という3つの手法が提案されている。
提案手法の有効性を検証するため,骨格に基づくジェスチャーと行動認識のための4つの挑戦的データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2020-07-07T07:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。