論文の概要: Toward Minimal Misalignment at Minimal Cost in One-Stage and Anchor-Free
Object Detection
- arxiv url: http://arxiv.org/abs/2112.08902v1
- Date: Thu, 16 Dec 2021 14:22:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 15:49:21.675210
- Title: Toward Minimal Misalignment at Minimal Cost in One-Stage and Anchor-Free
Object Detection
- Title(参考訳): ワンステージ・アンカーフリー物体検出における最小コストのミスアライメントに向けて
- Authors: Shuaizheng Hao, Hongzhe Liu, Ningwei Wang and Cheng Xu
- Abstract要約: 分類と回帰の分岐は、同じ規模と同じ空間的位置から特徴に対して異なる感受性を持つ。
本稿では,高い分類信頼点が高い回帰品質を持つという仮定に基づいて,点に基づく予測手法を提案する。
我々は,この現象を最小限のコストで解決することを目指しており,頭部ネットワークの微調整と,剛体ネットワークを置き換えた新しいラベル割り当て手法を提案する。
- 参考スコア(独自算出の注目度): 6.486325109549893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Common object detection models consist of classification and regression
branches, due to different task drivers, these two branches have different
sensibility to the features from the same scale level and the same spatial
location. The point-based prediction method, which is based on the assumption
that the high classification confidence point has the high regression quality,
leads to the misalignment problem. Our analysis shows, the problem is further
composed of scale misalignment and spatial misalignment specifically. We aim to
resolve the phenomenon at minimal cost: a minor adjustment of the head network
and a new label assignment method replacing the rigid one. Our experiments show
that, compared to the baseline FCOS, a one-stage and anchor-free object
detection model, our model consistently get around 3 AP improvement with
different backbones, demonstrating both simplicity and efficiency of our
method.
- Abstract(参考訳): 一般的なオブジェクト検出モデルは分類と回帰枝で構成され、タスクドライバによって異なるため、これら2つの枝は同じスケールレベルと同じ空間位置から特徴に対する感受性が異なる。
高い分類信頼点が高い回帰品質を持つという仮定に基づく点ベース予測法は,誤認識問題を引き起こす。
分析の結果,この問題は特にスケールミスと空間ミスアライメントで構成されていることがわかった。
我々は,ヘッドネットワークの微調整と,新しいラベル割り当て方式により,最小限のコストでこの現象を解消することを目指している。
実験の結果,一段階およびアンカーフリーの物体検出モデルであるfcosと比較して,異なるバックボーンを持つ3つのap改善が一貫して得られ,単純さと効率性が実証された。
関連論文リスト
- OCMG-Net: Neural Oriented Normal Refinement for Unstructured Point Clouds [18.234146052486054]
非構造点雲から指向性正規項を推定するための頑健な精錬法を提案する。
我々のフレームワークは、初期指向の正規性を洗練させるために、特徴空間に符号配向とデータ拡張を組み込んでいる。
従来手法に存在した騒音による方向の不整合の問題に対処するため, チャンファー正規距離と呼ばれる新しい指標を導入する。
論文 参考訳(メタデータ) (2024-09-02T09:30:02Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Layer-wise Customized Weak Segmentation Block and AIoU Loss for Accurate
Object Detection [7.3179451998143605]
そこで本研究では,各層におけるスケールカスタマイズオブジェクト特徴学習のために,画素レベルのSCWSブロックを提案する。
SCWSブロックを単発検出器に統合することにより、スケール認識オブジェクト検出器(SCOD)を構築し、異なるサイズのオブジェクトを自然かつ正確に検出する。
論文 参考訳(メタデータ) (2021-08-25T02:42:28Z) - Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。
また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。
実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文 参考訳(メタデータ) (2021-07-08T13:10:42Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - Novelty Detection via Robust Variational Autoencoding [13.664682865991255]
本稿では,トレーニングポイントの破壊を許容する新規性検出法を提案する。
本手法は,非破壊訓練点のモデルを生成することを目的とした,ロバストな変分オートエンコーダ(VAE)を訓練する。
論文 参考訳(メタデータ) (2020-06-09T22:34:27Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。