論文の概要: Single-Shot Two-Pronged Detector with Rectified IoU Loss
- arxiv url: http://arxiv.org/abs/2008.03511v1
- Date: Sat, 8 Aug 2020 12:36:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 12:06:01.823897
- Title: Single-Shot Two-Pronged Detector with Rectified IoU Loss
- Title(参考訳): 整流iou損失を有する単発2段検出器
- Authors: Keyang Wang and Lei Zhang
- Abstract要約: 本稿では,前後方向の異なる層間の関係を探索する,新しい2段階のトランスダクティブ・アイデアを提案する。
提案手法では,高次特徴と低次特徴の双方向移動を実現するための2段階ネットワーク(TPNet)を提案する。
- 参考スコア(独自算出の注目度): 10.616828072065093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the CNN based object detectors, feature pyramids are widely exploited to
alleviate the problem of scale variation across object instances. These object
detectors, which strengthen features via a top-down pathway and lateral
connections, are mainly to enrich the semantic information of low-level
features, but ignore the enhancement of high-level features. This can lead to
an imbalance between different levels of features, in particular a serious lack
of detailed information in the high-level features, which makes it difficult to
get accurate bounding boxes. In this paper, we introduce a novel two-pronged
transductive idea to explore the relationship among different layers in both
backward and forward directions, which can enrich the semantic information of
low-level features and detailed information of high-level features at the same
time. Under the guidance of the two-pronged idea, we propose a Two-Pronged
Network (TPNet) to achieve bidirectional transfer between high-level features
and low-level features, which is useful for accurately detecting object at
different scales. Furthermore, due to the distribution imbalance between the
hard and easy samples in single-stage detectors, the gradient of localization
loss is always dominated by the hard examples that have poor localization
accuracy. This will enable the model to be biased toward the hard samples. So
in our TPNet, an adaptive IoU based localization loss, named Rectified IoU
(RIoU) loss, is proposed to rectify the gradients of each kind of samples. The
Rectified IoU loss increases the gradients of examples with high IoU while
suppressing the gradients of examples with low IoU, which can improve the
overall localization accuracy of model. Extensive experiments demonstrate the
superiority of our TPNet and RIoU loss.
- Abstract(参考訳): CNNベースのオブジェクト検出器では、オブジェクトインスタンス間のスケール変動の問題を軽減するために、特徴ピラミッドが広く利用されている。
これらの物体検出器は、上向きの経路と横方向の接続によって特徴を強化し、主に低レベルの特徴のセマンティック情報を強化するが、高レベルの特徴の強化は無視する。
これにより、異なるレベルの機能間の不均衡、特にハイレベルな機能における詳細な情報不足が引き起こされ、正確なバウンディングボックスを得るのが困難になる。
本稿では,低レベル特徴のセマンティック情報と高レベル特徴の詳細な情報とを同時に強化し,下位方向と前方方向の両方の異なる層間の関係を探索する,新しい2段階のトランスダクティブ・アイデアを提案する。
提案手法では,高次特徴量と低次特徴量との双方向転送を実現するための2段階ネットワーク(TPNet)を提案する。
さらに, 単段検出器における硬質試料と簡易試料の分布の不均衡から, 局在損失の勾配は常に位置推定精度の低い硬質試料に支配されている。
これにより、モデルがハードサンプルに偏るようになる。
そこで,我々のTPNetでは,適応IoUに基づく局所化損失であるRectified IoU(RIoU)損失が,各試料の勾配を補正するために提案されている。
定性IoU損失は、高IoUの例の勾配を増大させ、低IoUの例の勾配を抑え、モデル全体の局所化精度を向上させる。
TPNetとRIoU損失の優位性を示す大規模な実験を行った。
関連論文リスト
- Simplicity Bias via Global Convergence of Sharpness Minimization [43.658859631741024]
ラベルノイズSGDは、2層ネットワークにおける損失ゼロのモデル多様体のシャープネスを常に最小化することを示す。
また、ゼロ損失多様体上の近似定常点における損失のヘッセンのトレースの新たな性質も見いだす。
論文 参考訳(メタデータ) (2024-10-21T18:10:37Z) - Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Learning Compact Features via In-Training Representation Alignment [19.273120635948363]
各エポックでは、トレーニングセットからサンプリングしたミニバッチを用いて損失関数の真の勾配を推定する。
In-Training Representation Alignment (ITRA) を提案する。
また,特徴表現学習における一致損失の望ましい影響を厳密に分析する。
論文 参考訳(メタデータ) (2022-11-23T22:23:22Z) - CAINNFlow: Convolutional block Attention modules and Invertible Neural
Networks Flow for anomaly detection and localization tasks [28.835943674247346]
本研究では, CBAMを組み込んだ複雑な関数モデルの設計を行い, 空間構造情報の保持と抽出を効果的に行うことができる。
CAINNFlowは,CNNとTransformerのバックボーンネットワークを特徴抽出器として,高度な精度と推論効率を実現する。
論文 参考訳(メタデータ) (2022-06-04T13:45:08Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - LC3Net: Ladder context correlation complementary network for salient
object detection [0.32116198597240836]
我々は,新しいラグコンテキスト相関補完ネットワーク (LC3Net) を提案する。
FCBはフィルタリング可能な畳み込みブロックであり、初期特徴の多様性に関する情報の自動収集を支援する。
DCMは、異なるレベルの特徴の密集を促進するための密接なクロスモジュールである。
BCDは双方向圧縮デコーダであり、マルチスケール機能の段階的縮小を支援する。
論文 参考訳(メタデータ) (2021-10-21T03:12:32Z) - Topological obstructions in neural networks learning [67.8848058842671]
損失勾配関数フローのグローバル特性について検討する。
損失関数とそのモースコンプレックスの位相データ解析を用いて,損失面の大域的特性と勾配軌道に沿った局所的挙動を関連付ける。
論文 参考訳(メタデータ) (2020-12-31T18:53:25Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。