論文の概要: Improving Object Detection and Attribute Recognition by Feature
Entanglement Reduction
- arxiv url: http://arxiv.org/abs/2108.11501v1
- Date: Wed, 25 Aug 2021 22:27:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-27 14:03:59.230627
- Title: Improving Object Detection and Attribute Recognition by Feature
Entanglement Reduction
- Title(参考訳): 特徴エンタングルメント低減による物体検出と属性認識の改善
- Authors: Zhaoheng Zheng, Arka Sadhu and Ram Nevatia
- Abstract要約: オブジェクト検出は属性非依存であるべきであり、属性は主にオブジェクト非依存であることを示す。
我々は、カテゴリと属性の特徴を独立に計算する2ストリームモデルを用いて、それらを分離するが、分類ヘッドは興味の領域(RoIs)を共有する。
従来のシングルストリームモデルと比較すると,Visual GenomeのサブセットであるVG-20よりも,教師付きタスクと属性転送タスクにおいて大幅な改善が見られた。
- 参考スコア(独自算出の注目度): 26.20319853343761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore object detection with two attributes: color and material. The task
aims to simultaneously detect objects and infer their color and material. A
straight-forward approach is to add attribute heads at the very end of a usual
object detection pipeline. However, we observe that the two goals are in
conflict: Object detection should be attribute-independent and attributes be
largely object-independent. Features computed by a standard detection network
entangle the category and attribute features; we disentangle them by the use of
a two-stream model where the category and attribute features are computed
independently but the classification heads share Regions of Interest (RoIs).
Compared with a traditional single-stream model, our model shows significant
improvements over VG-20, a subset of Visual Genome, on both supervised and
attribute transfer tasks.
- Abstract(参考訳): 色と素材という2つの属性で物体検出を探索する。
このタスクは、オブジェクトを同時に検出し、その色と素材を推測することを目的としている。
ストレートフォワードアプローチは、通常のオブジェクト検出パイプラインの最後に属性ヘッドを追加することである。
オブジェクト検出は属性独立でなければならないし、属性は主にオブジェクト独立である。
カテゴリーと属性の特徴を独立に計算するが、分類ヘッドは興味の領域(RoIs)を共有している2ストリームモデルを用いることで、カテゴリーと属性の特徴を絞った標準検出ネットワークによって計算される特徴を解消する。
従来のシングルストリームモデルと比較すると,Visual GenomeのサブセットであるVG-20よりも,教師付きタスクと属性転送タスクにおいて大幅な改善が見られた。
関連論文リスト
- Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z) - Rethinking the Aligned and Misaligned Features in One-stage Object
Detection [9.270523894683278]
1段階の物体検出器は、検出結果を予測するために点特徴に依存する。
タスク毎に整列および非整合性を生成できるシンプルでプラグイン演算子を提案する。
OAT(object-aligned and task-disentangled operator)に基づくOAT-Netを提案する。
論文 参考訳(メタデータ) (2021-08-27T08:40:37Z) - I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage
Object Detectors [64.93963042395976]
暗黙のInstance-Invariant Network(I3Net)は、ワンステージ検出器の適応に適しています。
i3netは、異なる層における深い特徴の自然な特徴を利用してインスタンス不変な特徴を暗黙的に学習する。
実験によると、I3Netはベンチマークデータセットの最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2021-03-25T11:14:36Z) - AttriMeter: An Attribute-guided Metric Interpreter for Person
Re-Identification [100.3112429685558]
Person ReIDシステムは、2人とのマッチング時にのみ距離や類似性を提供します。
CNN ベースの ReID モデルの結果を意味的に,定量的に説明する Attribute-Guided Metric Interpreter を提案する。
論文 参考訳(メタデータ) (2021-03-02T03:37:48Z) - Attention-based Joint Detection of Object and Semantic Part [4.389917490809522]
我々のモデルは2つのFaster-RCNNモデルに基づいて作成され、それらの特徴を共有して両方の表現を拡張します。
PASCAL-Part 2010データセットの実験では、関節検出は物体検出と部分検出の両方を同時に改善できることが示された。
論文 参考訳(メタデータ) (2020-07-05T18:54:10Z) - Adaptive Object Detection with Dual Multi-Label Prediction [78.69064917947624]
本稿では,適応オブジェクト検出のための新しいエンド・ツー・エンドの非教師付き深部ドメイン適応モデルを提案する。
モデルはマルチラベル予測を利用して、各画像内の対象カテゴリ情報を明らかにする。
本稿では,オブジェクト検出を支援するための予測整合正則化機構を提案する。
論文 参考訳(メタデータ) (2020-03-29T04:23:22Z) - OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features [14.115782214599015]
ワンショットオブジェクト検出は、単一のデモによって定義されたオブジェクトを検出することで構成される。
ローカライズと認識を共同で行うワンステージシステムを構築している。
いくつかの挑戦的領域に対する実験的評価は,本手法が未知のクラスを検出できることを示唆している。
論文 参考訳(メタデータ) (2020-03-15T11:39:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。