論文の概要: Category Query Learning for Human-Object Interaction Classification
- arxiv url: http://arxiv.org/abs/2303.14005v1
- Date: Fri, 24 Mar 2023 13:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-27 14:19:49.585529
- Title: Category Query Learning for Human-Object Interaction Classification
- Title(参考訳): 人間とオブジェクトのインタラクション分類のためのカテゴリクエリ学習
- Authors: Chi Xie, Fangao Zeng, Yue Hu, Shuang Liang and Yichen Wei
- Abstract要約: 従来のHOI手法とは違って,カテゴリクエリ学習と呼ばれる新しい補完的手法を提案する。
このアイデアは、初期のマルチラベル画像分類法によって動機付けられているが、人間と物体の相互作用分類に挑戦するタスクに初めて適用されたものである。
提案手法は3つのHOIベースラインで検証され,2つのベンチマークで新たな最先端結果が得られる。
- 参考スコア(独自算出の注目度): 25.979131884959923
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unlike most previous HOI methods that focus on learning better human-object
features, we propose a novel and complementary approach called category query
learning. Such queries are explicitly associated to interaction categories,
converted to image specific category representation via a transformer decoder,
and learnt via an auxiliary image-level classification task. This idea is
motivated by an earlier multi-label image classification method, but is for the
first time applied for the challenging human-object interaction classification
task. Our method is simple, general and effective. It is validated on three
representative HOI baselines and achieves new state-of-the-art results on two
benchmarks.
- Abstract(参考訳): 従来のhoi法と異なり,人間-対象の特徴の学習に焦点を合わせ,カテゴリ問合せ学習と呼ばれる新しい補完的アプローチを提案する。
このようなクエリは、インタラクションカテゴリに明示的に関連付けられ、トランスフォーマーデコーダを介してイメージ固有のカテゴリ表現に変換され、補助的なイメージレベルの分類タスクを介して学習される。
このアイデアは、初期のマルチラベル画像分類法に動機づけられているが、挑戦的な人間と対象のインタラクション分類タスクに初めて適用される。
私たちの方法は単純で汎用的で効果的です。
3つのHOIベースラインで検証され、2つのベンチマークで新たな最先端結果が得られる。
関連論文リスト
- Preview-based Category Contrastive Learning for Knowledge Distillation [53.551002781828146]
知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。
まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。
カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文 参考訳(メタデータ) (2024-10-18T03:31:00Z) - A Study on Representation Transfer for Few-Shot Learning [5.717951523323085]
ほとんどショットの分類は、いくつかのラベル付き例を使って、新しいオブジェクトカテゴリを適切に分類することを目的としていない。
本研究では, 様々な特徴表現の体系的研究を行い, 数発の分類を行う。
より複雑なタスクからの学習は、数ショットの分類においてより良い表現を与える傾向にある。
論文 参考訳(メタデータ) (2022-09-05T17:56:02Z) - Automatically Discovering Novel Visual Categories with Self-supervised
Prototype Learning [68.63910949916209]
本稿では,大規模な画像収集において未知のカテゴリを識別することを目的とした,新しいカテゴリ発見(NCD)の課題に取り組む。
本稿では,プロトタイプ表現学習とプロトタイプ自己学習という,2つの主要な段階からなる適応型プロトタイプ学習手法を提案する。
本研究では,4つのベンチマークデータセットについて広範な実験を行い,提案手法の有効性とロバスト性を示す。
論文 参考訳(メタデータ) (2022-08-01T16:34:33Z) - Comparison Knowledge Translation for Generalizable Image Classification [31.530232003512957]
画像分類タスクにおいて,人間の認識機構をエミュレートする一般化可能なフレームワークを構築した。
本稿では,比較分類器とマッチング判別器を組み合わせた比較分類翻訳ネットワーク(CCT-Net)を提案する。
CCT-Netは、未確認カテゴリにおける驚くほどの一般化能力と、対象カテゴリにおけるSOTA性能を実現する。
論文 参考訳(メタデータ) (2022-05-07T11:05:18Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - Deep Metric Learning for Few-Shot Image Classification: A Selective
Review [38.71276383292809]
少ないショット画像分類は、少数の画像のみに基づいて人間の認識レベルを達成することを目的とした課題である。
近年,メタラーニングやトランスファーラーニング,メトリックラーニングといったディープラーニングアルゴリズムが採用され,最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2021-05-17T20:27:59Z) - Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。
既存のほとんどの方法は個々の画像のみを入力とする。
そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T10:19:02Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。