論文の概要: Condensing Two-stage Detection with Automatic Object Key Part Discovery
- arxiv url: http://arxiv.org/abs/2006.05597v3
- Date: Thu, 13 Aug 2020 01:08:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:40:47.208509
- Title: Condensing Two-stage Detection with Automatic Object Key Part Discovery
- Title(参考訳): 物体鍵部分の自動発見による2段階検出
- Authors: Zhe Chen, Jing Zhang, Dacheng Tao
- Abstract要約: 2段階の物体検出器は通常、高い精度を達成するために、検出ヘッドのために過度に大きなモデルを必要とする。
そこで本研究では,2段階検出ヘッドのモデルパラメータを,対象キー部分に集中させることで縮合・縮小できることを示す。
提案手法は、一般的な2段検出ヘッドのモデルパラメータの約50%を放棄しながら、元の性能を一貫して維持する。
- 参考スコア(独自算出の注目度): 87.1034745775229
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern two-stage object detectors generally require excessively large models
for their detection heads to achieve high accuracy. To address this problem, we
propose that the model parameters of two-stage detection heads can be condensed
and reduced by concentrating on object key parts. To this end, we first
introduce an automatic object key part discovery task to make neural networks
discover representative sub-parts in each foreground object. With these
discovered key parts, we then decompose the object appearance modeling into a
key part modeling process and a global modeling process for detection. Key part
modeling encodes fine and detailed features from the discovered key parts, and
global modeling encodes rough and holistic object characteristics. In practice,
such decomposition allows us to significantly abridge model parameters without
sacrificing much detection accuracy. Experiments on popular datasets illustrate
that our proposed technique consistently maintains original performance while
waiving around 50% of the model parameters of common two-stage detection heads,
with the performance only deteriorating by 1.5% when waiving around 96% of the
original model parameters. Codes are released on:
https://github.com/zhechen/Condensing2stageDetection.
- Abstract(参考訳): 現代の2段階の物体検出器は、高い精度を達成するために検出ヘッドに過大なモデルを必要とする。
この問題に対処するため,2段検出ヘッドのモデルパラメータを,対象キー部分に集中させることで縮合・縮小できることを示す。
この目的のために、まず、ニューラルネットワークが各前景オブジェクトの代表部分を検出するための自動オブジェクトキー部分発見タスクを導入する。
これらの重要な部分から、オブジェクトの外観モデリングを重要部分モデリングプロセスと、検出のためのグローバルなモデリングプロセスに分解する。
キー部分モデリングは発見済みのキー部分の細かな特徴をエンコードし、グローバルモデリングは粗野で総合的なオブジェクト特性をエンコードする。
実際、このような分解は、多くの検出精度を犠牲にすることなく、モデルパラメータを著しく橋渡しすることができる。
一般的なデータセットを用いた実験により,提案手法は,従来の2段階検出ヘッドのモデルパラメータの約50%を回避しつつも,元のモデルパラメータの約96%を放棄した場合に,性能が1.5%低下する程度に抑えられることを示した。
コードは、https://github.com/zhechen/Condensing2stageDetectionでリリースされている。
関連論文リスト
- Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - D\'etection d'Objets dans les documents num\'eris\'es par r\'eseaux de
neurones profonds [0.0]
本研究では,テキスト行の検出,動作分割,筆記支援など,文書レイアウト解析に関連する複数のタスクについて検討する。
2つの異なるアプローチに従う2つのディープニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2023-01-27T14:45:45Z) - Rethinking the Detection Head Configuration for Traffic Object Detection [11.526701794026641]
本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。
提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-08T02:23:57Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - An Improvement of Object Detection Performance using Multi-step Machine
Learnings [0.0]
本稿では,キャリブレーションモデルと呼ばれる後処理ステップを導入するマルチステップ概念に基づく物体検出の強化について述べる。
キャリブレーションモデルは畳み込みニューラルネットワークで構成され、入力のドメイン知識に基づいてリッチなコンテキスト情報を利用する。
論文 参考訳(メタデータ) (2021-01-19T11:32:27Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Attention-based Joint Detection of Object and Semantic Part [4.389917490809522]
我々のモデルは2つのFaster-RCNNモデルに基づいて作成され、それらの特徴を共有して両方の表現を拡張します。
PASCAL-Part 2010データセットの実験では、関節検出は物体検出と部分検出の両方を同時に改善できることが示された。
論文 参考訳(メタデータ) (2020-07-05T18:54:10Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z) - Distillation of neural network models for detection and description of
key points of images [0.0]
本研究の目的は,キーポイントの検出と記述のよりコンパクトなモデルを得ることである。
キーポイント検出方法をテストするための新しいデータセットと、割り当てられたキーポイントの新たな品質指標が導入された。
パラメータ数が大幅に少ない新しいモデルでは、元のモデルの精度に近い点マッチングの精度を示す。
論文 参考訳(メタデータ) (2020-05-18T18:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。