論文の概要: Highlighting Object Category Immunity for the Generalization of
Human-Object Interaction Detection
- arxiv url: http://arxiv.org/abs/2202.09492v1
- Date: Sat, 19 Feb 2022 02:08:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 08:40:06.514817
- Title: Highlighting Object Category Immunity for the Generalization of
Human-Object Interaction Detection
- Title(参考訳): 人-物相互作用検出の一般化のための軽量物体カテゴリー免疫
- Authors: Xinpeng Liu, Yong-Lu Li, Cewu Lu
- Abstract要約: 異なるオブジェクトと同一動詞の合成における性能ギャップを評価するために, mPD (mean Performance Degradation) という新しい指標を提案する。
mPD をキューとして,HOI の一般化を促進するために Object Category (OC) Immunity を提案する。
OC免疫性を実現するために,OC免疫の入力を分離し,OC免疫表現を抽出し,不確実性を利用して未確認物体に一般化するOC免疫ネットワークを提案する。
- 参考スコア(独自算出の注目度): 49.40372168524452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-Object Interaction (HOI) detection plays a core role in activity
understanding. As a compositional learning problem (human-verb-object),
studying its generalization matters. However, widely-used metric mean average
precision (mAP) fails to model the compositional generalization well. Thus, we
propose a novel metric, mPD (mean Performance Degradation), as a complementary
of mAP to evaluate the performance gap among compositions of different objects
and the same verb. Surprisingly, mPD reveals that previous methods usually
generalize poorly. With mPD as a cue, we propose Object Category (OC) Immunity
to boost HOI generalization. The idea is to prevent model from learning
spurious object-verb correlations as a short-cut to over-fit the train set. To
achieve OC-immunity, we propose an OC-immune network that decouples the inputs
from OC, extracts OC-immune representations, and leverages uncertainty
quantification to generalize to unseen objects. In both conventional and
zero-shot experiments, our method achieves decent improvements. To fully
evaluate the generalization, we design a new and more difficult benchmark, on
which we present significant advantage. The code is available at
https://github.com/Foruck/OC-Immunity.
- Abstract(参考訳): ヒューマン・オブジェクト・インタラクション(hoi)検出は、活動理解において重要な役割を果たす。
構成学習問題(人間-動詞-対象)として、その一般化について研究する。
しかし、広く使われている平均平均精度(mAP)は構成一般化をうまくモデル化できない。
そこで本研究では,mAP の補完として mPD (mean Performance Degradation) を提案する。
意外なことに、mPDは従来の手法が一般的にあまり一般化していないことを明らかにしている。
mPD をキューとして,HOI の一般化を促進するために Object Category (OC) Immunity を提案する。
モデルは、列車のセットに過度にフィットするショートカットとして、刺激的なオブジェクトとバーブの相関を学習するのを防ぐ。
OC免疫性を実現するために,OC免疫の入力を分離し,OC免疫表現を抽出し,不確実な定量化を活用して未知の物体に一般化するOC免疫ネットワークを提案する。
従来の実験とゼロショット実験の両方において,本手法は良好な改善を実現する。
一般化を徹底的に評価するために,我々は,新しい,より難しいベンチマークを設計した。
コードはhttps://github.com/foruck/oc-immunityで入手できる。
関連論文リスト
- Effort: Efficient Orthogonal Modeling for Generalizable AI-Generated Image Detection [66.16595174895802]
既存のAI生成画像(AIGI)検出手法は、しばしば限定的な一般化性能に悩まされる。
本稿では、AIGI検出において、これまで見過ごされてきた重要な非対称性現象を同定する。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Debiasing Counterfactuals In the Presence of Spurious Correlations [0.98342301244574]
我々は、(i)人気のデバイアス分類器と(ii)対実画像生成の両方を統合した、最初のエンドツーエンドトレーニングフレームワークを紹介する。
以上の結果から, 人口全体にわたる一般化可能なマーカーを学習し, (ii) 急激な相関を無視し, 根底にある疾患の病理に焦点をあてる脱バイアス法が実証された。
論文 参考訳(メタデータ) (2023-08-21T19:01:45Z) - Chairs Can be Stood on: Overcoming Object Bias in Human-Object
Interaction Detection [22.3445174577181]
画像中のHuman-Object Interaction(HOI)は、高レベルの視覚的理解に向けた重要なステップである。
本稿では,検出対象下でのインタラクションの分散を再バランスする,新しいプラグアンドプレイ型オブジェクト指向デバイアスメモリ(ODM)手法を提案する。
提案手法は,特に各オブジェクト下での稀な相互作用において,ベースラインよりも一貫した,重要な改善をもたらす。
論文 参考訳(メタデータ) (2022-07-06T01:55:28Z) - Quality-aware Part Models for Occluded Person Re-identification [77.24920810798505]
咬合は人体再識別(ReID)にとって大きな課題となる
既存のアプローチは一般的に、計算効率とReIDの精度の両面で最適であるように、目に見える身体の部品を推測するための外部ツールに依存している。
閉塞型ReIDのためのQPM(Quality-Aware Part Models)という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-01-01T03:51:09Z) - Universal-Prototype Augmentation for Few-Shot Object Detection [128.4592084104352]
Few-shot Object Detection (FSOD)は、ラベル付きサンプルの少ない新しいオブジェクト検出のパフォーマンスを強化することを目的とする。
少数のサンプルの制約を緩和するため、新しいオブジェクトの学習機能の一般化能力の向上が重要な役割を果たす。
我々は,すべての対象カテゴリから学習した新しいプロトタイプ,すなわちユニバーサルプロトタイプを提案する。
論文 参考訳(メタデータ) (2021-03-01T15:35:36Z) - MUTANT: A Training Paradigm for Out-of-Distribution Generalization in
Visual Question Answering [58.30291671877342]
MUTANTは、モデルが知覚的に類似しているが意味的に異なる入力の変異に露出する訓練パラダイムである。
MUTANTは、VQA-CPに新しい最先端の精度を確立し、10.57%$改善した。
論文 参考訳(メタデータ) (2020-09-18T00:22:54Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。