論文の概要: Foreground Guidance and Multi-Layer Feature Fusion for Unsupervised
Object Discovery with Transformers
- arxiv url: http://arxiv.org/abs/2210.13053v1
- Date: Mon, 24 Oct 2022 09:19:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 17:36:47.937208
- Title: Foreground Guidance and Multi-Layer Feature Fusion for Unsupervised
Object Discovery with Transformers
- Title(参考訳): 変圧器を用いた教師なし物体発見のための前景誘導と多層特徴融合
- Authors: Zhiwei Lin, Zengyu Yang and Yongtao Wang
- Abstract要約: Foreground guidance and MUlti-Layer feature fusion for unsupervised object discovery, called FORMULA。
本報告では,本手法を用いて,前景領域を特徴地図上に強調表示し,対象位置を反復的に洗練する,既設のUOD検出器を用いた前景誘導戦略を提案する。
オブジェクト検出におけるスケール変動問題を解決するため,異なるスケールでオブジェクトに応答する特徴を集約する多層機能融合モジュールを設計した。
- 参考スコア(独自算出の注目度): 8.88037278008401
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Unsupervised object discovery (UOD) has recently shown encouraging progress
with the adoption of pre-trained Transformer features. However, current methods
based on Transformers mainly focus on designing the localization head (e.g.,
seed selection-expansion and normalized cut) and overlook the importance of
improving Transformer features. In this work, we handle UOD task from the
perspective of feature enhancement and propose FOReground guidance and
MUlti-LAyer feature fusion for unsupervised object discovery, dubbed FORMULA.
Firstly, we present a foreground guidance strategy with an off-the-shelf UOD
detector to highlight the foreground regions on the feature maps and then
refine object locations in an iterative fashion. Moreover, to solve the scale
variation issues in object detection, we design a multi-layer feature fusion
module that aggregates features responding to objects at different scales. The
experiments on VOC07, VOC12, and COCO 20k show that the proposed FORMULA
achieves new state-of-the-art results on unsupervised object discovery. The
code will be released at https://github.com/VDIGPKU/FORMULA.
- Abstract(参考訳): unsupervised object discovery(uod)は最近、事前訓練されたトランスフォーマー機能の採用による進歩を奨励している。
しかし、現在の変圧器に基づく方法は、主にローカライズヘッド(種子選択伸長や正規化カットなど)の設計に重点を置いており、変圧器の性能向上の重要性を見落としている。
本研究では,機能強化の観点からUODタスクを処理し,FORMULAと呼ばれる非教師対象発見のためのフォアグラウンドガイダンスとMUlti-Layer機能融合を提案する。
まず,市販のuod検出器を用いて,特徴地図上の前景領域を強調表示し,オブジェクト位置を反復的に洗練するフォアグラウンド誘導戦略を提案する。
さらに,オブジェクト検出におけるスケール変動問題を解決するために,異なるスケールでオブジェクトに応答する特徴を集約する多層機能融合モジュールを設計する。
VOC07、VOC12、COCO 20kの実験により、提案されたFORTMULAは、教師なし物体の発見において、新しい最先端の結果が得られることが示された。
コードはhttps://github.com/VDIGPKU/FORMULAで公開される。
関連論文リスト
- PointOBB: Learning Oriented Object Detection via Single Point
Supervision [55.88982271340328]
本稿では,オブジェクト指向物体検出のための最初の単一点ベース OBB 生成法である PointOBB を提案する。
PointOBBは、オリジナルビュー、リサイズビュー、ローテーション/フリップ(rot/flp)ビューの3つのユニークなビューの協調利用を通じて動作する。
DIOR-RとDOTA-v1.0データセットの実験結果は、PointOBBが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2023-11-23T15:51:50Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - ZJU ReLER Submission for EPIC-KITCHEN Challenge 2023: Semi-Supervised
Video Object Segmentation [62.98078087018469]
マルチ機能スケールでトランスフォーマーを組み込んだAOTフレームワークの派生版であるMSDeAOTを紹介する。
MSDeAOTは16のストライドを持つ特徴尺度を用いて、以前のフレームから現在のフレームへ効率的にオブジェクトマスクを伝搬する。
また,GPMを8ストライドで改良した機能スケールで採用することで,小型物体の検出・追跡の精度が向上した。
論文 参考訳(メタデータ) (2023-07-05T03:43:15Z) - Feature Shrinkage Pyramid for Camouflaged Object Detection with
Transformers [34.42710399235461]
視覚変換器は、最近、擬似的オブジェクト検出において、強いグローバルなコンテキストモデリング能力を示した。
ローカリティモデリングの効率の低下とデコーダの機能集約の不足という2つの大きな制限に悩まされている。
本研究では, 局所性向上した隣接する変圧器の特徴を階層的に復号化することを目的とした, 変圧器をベースとしたFSPNet(Feature Shrinkage Pyramid Network)を提案する。
論文 参考訳(メタデータ) (2023-03-26T20:50:58Z) - Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。
まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。
第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection [85.170578641966]
半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
論文 参考訳(メタデータ) (2022-12-19T06:56:14Z) - An Extendable, Efficient and Effective Transformer-based Object Detector [95.06044204961009]
我々は、視覚・検出変換器(ViDT)を統合し、効果的で効率的な物体検出装置を構築する。
ViDTは、最近のSwin Transformerをスタンドアロンのオブジェクト検出器に拡張するために、再構成されたアテンションモジュールを導入した。
オブジェクト検出とインスタンスセグメンテーションのための共同タスク学習をサポートするために、ViDT+に拡張する。
論文 参考訳(メタデータ) (2022-04-17T09:27:45Z) - Task Specific Attention is one more thing you need for object detection [0.0]
我々は、いくつかの注意モジュールと新しいタスク特定分割変換器(TSST)を組み合わせることで、COCOの最良の結果を生成するのに十分な方法を提案する。
本稿では,複数の注意モジュールと新しいタスク特定分割変換器(TSST)を組み合わせることで,COCOの最良の結果を生成するのに十分な方法を提案する。
論文 参考訳(メタデータ) (2022-02-18T07:09:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。