論文の概要: BoxMask: Revisiting Bounding Box Supervision for Video Object Detection
- arxiv url: http://arxiv.org/abs/2210.06008v1
- Date: Wed, 12 Oct 2022 08:25:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 14:46:54.779284
- Title: BoxMask: Revisiting Bounding Box Supervision for Video Object Detection
- Title(参考訳): BoxMask:ビデオオブジェクト検出のためのバウンディングボックススーパービジョンを再考
- Authors: Khurram Azeem Hashmi, Alain Pagani, Didier Stricker, Muhammamd Zeshan
Afzal
- Abstract要約: そこで,BoxMaskを提案する。このBoxMaskは,クラス対応の画素レベルの情報を取り入れることで,識別表現を学習する。
提案されたモジュールは、検出を促進するため、任意の領域ベースの検出器に懸命に統合することができる。
- 参考スコア(独自算出の注目度): 11.255962936937744
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a new, simple yet effective approach to uplift video object
detection. We observe that prior works operate on instance-level feature
aggregation that imminently neglects the refined pixel-level representation,
resulting in confusion among objects sharing similar appearance or motion
characteristics. To address this limitation, we propose BoxMask, which
effectively learns discriminative representations by incorporating class-aware
pixel-level information. We simply consider bounding box-level annotations as a
coarse mask for each object to supervise our method. The proposed module can be
effortlessly integrated into any region-based detector to boost detection.
Extensive experiments on ImageNet VID and EPIC KITCHENS datasets demonstrate
consistent and significant improvement when we plug our BoxMask module into
numerous recent state-of-the-art methods.
- Abstract(参考訳): 本稿では,ビデオオブジェクト検出のための新しい,シンプルかつ効果的なアプローチを提案する。
先行研究は,改良された画素レベルの表現を瞬時に無視し,類似した外観や動作特性を共有するオブジェクト間で混乱が生じている。
そこで我々は,この制限に対処するために,クラス認識された画素レベル情報を取り込むことで識別表現を効果的に学習するboxmaskを提案する。
ボックスレベルのアノテーションを各オブジェクトがメソッドを監督する粗いマスクとして単純に考える。
提案するモジュールは、検出を促進するために、任意の領域ベースの検出器に無力に統合することができる。
ImageNet VIDとEPIC KITCHENSデータセットの大規模な実験は、BoxMaskモジュールを最新の最先端の多くのメソッドにプラグインする際に、一貫性と大幅な改善を示す。
関連論文リスト
- Learning Referring Video Object Segmentation from Weak Annotation [78.45828085350936]
RVOS(Referring Video Object segmentation)は、対象物を記述する文に基づいて、対象物をすべてのビデオフレームにセグメント化することを目的としたタスクである。
そこで本研究では, RVOS に対する十分な監視を提供しながら, アノテーションの労力を 8 倍に削減する新たなアノテーション方式を提案する。
私たちのスキームは、最初にオブジェクトが現れるフレームのマスクと、残りのフレームのバウンディングボックスのみを必要とする。
論文 参考訳(メタデータ) (2023-08-04T06:50:52Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Oriented Bounding Boxes for Small and Freely Rotated Objects [7.6997148655751895]
任意のサイズの自由回転物体を処理する新しい物体検出方法を提示する。
この方法は、グリッドセル位置におけるターゲットオブジェクトの特徴の正確な位置と向きを符号化する。
xView と DOTA データセットの評価から,提案手法は既存の最先端手法よりも一様に性能を向上することが示された。
論文 参考訳(メタデータ) (2021-04-24T02:04:49Z) - BBAM: Bounding Box Attribution Map for Weakly Supervised Semantic and
Instance Segmentation [19.55647093153416]
バウンディングボックスアノテーションを用いた弱い教師付きセグメンテーション手法は、オブジェクトを含む各ボックスからピクセルレベルのマスクを取得することに焦点を当てている。
本研究では,対象検出器が生成する画像の最小領域を画像全体とほぼ同程度に求めることにより,訓練対象検出器の挙動から得られる高次情報を利用する。
これらの領域はバウンディングボックスアトリビューションマップ(bbam)を構成しており、バウンディングボックス内の対象オブジェクトを識別し、弱い教師付きセマンティクスとcocoインスタンスセグメンテーションのための擬似基底となる。
論文 参考訳(メタデータ) (2021-03-16T08:29:33Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - Generating Masks from Boxes by Mining Spatio-Temporal Consistencies in
Videos [159.02703673838639]
フレーム毎のバウンディングボックスアノテーションからセグメンテーションマスクを生成する手法を動画で紹介します。
得られた正確なマスクを用いて、ビデオオブジェクトセグメンテーション(VOS)ネットワークの弱い教師付きトレーニングを行う。
追加データは、VOSとより困難なトラッキングドメインの両方で最先端の結果をもたらす大幅に優れた一般化パフォーマンスを提供します。
論文 参考訳(メタデータ) (2021-01-06T18:56:24Z) - Weakly-Supervised Saliency Detection via Salient Object Subitizing [57.17613373230722]
我々は,クラス非依存であるため,弱い監督としてサリエンシー・サブイタライジングを導入する。
これにより、監視はサリエンシー検出の特性と整合することができます。
5つのベンチマークデータセットに対して広範な実験を行う。
論文 参考訳(メタデータ) (2021-01-04T12:51:45Z) - Learning Object Scale With Click Supervision for Object Detection [29.421113887739413]
本稿では,CNN視覚化をクリック管理に組み込んで擬似地下構造を生成する,シンプルで効果的な手法を提案する。
これらの擬似グラウンドトラスカンは、完全に監視された検出器の訓練に使用される。
PASCAL VOC2007 とVOC 2012 データセットによる実験結果から,提案手法はオブジェクトのスケールを推定する上で,はるかに高い精度が得られることが示された。
論文 参考訳(メタデータ) (2020-02-20T03:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。