論文の概要: Delving into the Imbalance of Positive Proposals in Two-stage Object
Detection
- arxiv url: http://arxiv.org/abs/2005.11472v1
- Date: Sat, 23 May 2020 04:54:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:36:01.849822
- Title: Delving into the Imbalance of Positive Proposals in Two-stage Object
Detection
- Title(参考訳): 2段階物体検出における肯定的提案の不均衡
- Authors: Zheng Ge, Zequn Jie, Xin Huang, Chengzheng Li, Osamu Yoshie
- Abstract要約: 本研究では,不均衡問題に関して2つの重要な議論は行われなかった。
最初の不均衡は、多くの低品質のRPN提案にある。
2番目の不均衡は、不均衡な接地トラス数に由来する。
- 参考スコア(独自算出の注目度): 23.558504838033844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imbalance issue is a major yet unsolved bottleneck for the current object
detection models. In this work, we observe two crucial yet never discussed
imbalance issues. The first imbalance lies in the large number of low-quality
RPN proposals, which makes the R-CNN module (i.e., post-classification layers)
become highly biased towards the negative proposals in the early training
stage. The second imbalance stems from the unbalanced ground-truth numbers
across different testing images, resulting in the imbalance of the number of
potentially existing positive proposals in testing phase. To tackle these two
imbalance issues, we incorporates two innovations into Faster R-CNN: 1) an
R-CNN Gradient Annealing (RGA) strategy to enhance the impact of positive
proposals in the early training stage. 2) a set of Parallel R-CNN Modules (PRM)
with different positive/negative sampling ratios during training on one same
backbone. Our RGA and PRM can totally bring 2.0% improvements on AP on COCO
minival. Experiments on CrowdHuman further validates the effectiveness of our
innovations across various kinds of object detection tasks.
- Abstract(参考訳): 不均衡問題は、現在のオブジェクト検出モデルにとって、大きな問題であるが未解決のボトルネックである。
本研究では,不均衡問題に関して2つの重要な議論は行われなかった。
第1の不均衡は、R-CNNモジュール(すなわち、後分類レイヤー)が初期のトレーニング段階でのネガティブな提案に対して非常に偏りを持つような、多数の低品質のRPN提案にある。
第2の不均衡は、異なるテスト画像にまたがる不均衡な接地数に起因し、テストフェーズにおける潜在的に有望な提案の数の不均衡をもたらす。
これら2つの不均衡問題に対処するため、我々はより高速なR-CNNに2つのイノベーションを取り入れた。
1) R-CNNグラディエントアニーリング(RGA)戦略は, 早期研修における肯定的提案の影響を高める。
2) 1つのバックボーンのトレーニング中に正・負のサンプリング比が異なる並列R-CNNモジュール(PRM)のセット。
当社のRGAとPRMは、COCOミニバルでAPを2.0%改善することができます。
crowdhumanの実験は、さまざまなオブジェクト検出タスクにおけるイノベーションの有効性をさらに検証します。
関連論文リスト
- An Early FIRST Reproduction and Improvements to Single-Token Decoding for Fast Listwise Reranking [50.81324768683995]
FIRSTは、学習からランクへの目的を統合し、最初の生成されたトークンのみのロジットを活用する新しいアプローチである。
我々は、FIRSTの評価をTRECディープラーニングデータセット(DL19-22)に拡張し、様々な領域でその堅牢性を検証する。
我々の実験は、単一トークンの高速リランクは、ドメイン外リランクの品質を損なうものではないことを確認した。
論文 参考訳(メタデータ) (2024-11-08T12:08:17Z) - Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques [65.55451717632317]
我々は,MARLHF(Multi-Agent Reinforcement Learning from Human Feedback)について検討し,理論的基礎と実証的検証の両方について検討した。
我々は,このタスクを,一般ゲームにおける嗜好のみのオフラインデータセットからナッシュ均衡を識別するものとして定義する。
本研究は,MARLHFの多面的アプローチを基礎として,効果的な嗜好に基づくマルチエージェントシステムの実現を目指している。
論文 参考訳(メタデータ) (2024-09-01T13:14:41Z) - Recurrent Bilinear Optimization for Binary Neural Networks [58.972212365275595]
BNNは、実数値重みとスケールファクターの内在的双線型関係を無視している。
私たちの仕事は、双線形の観点からBNNを最適化する最初の試みです。
我々は、様々なモデルやデータセット上で最先端のBNNに対して印象的な性能を示す頑健なRBONNを得る。
論文 参考訳(メタデータ) (2022-09-04T06:45:33Z) - Boosting R-CNN: Reweighting R-CNN Samples by RPN's Error for Underwater
Object Detection [12.291063755824585]
本稿では,3つの主成分からなる2段式水中検出器「ブースティングR-CNN」を提案する。
まず、高品質な提案を提供するRetinaRPNという新しい領域提案ネットワークを提案する。
第2に、確率的推論パイプラインを導入し、第1ステージ前の不確実性と第2ステージの分類スコアを組み合わせる。
論文 参考訳(メタデータ) (2022-06-28T03:29:20Z) - Dynamic Sparse R-CNN [20.51525561016167]
Sparse R-CNNは、スパースで学習可能な提案ボックスと提案機能のセット予測による、最近の強力なオブジェクト検出ベースラインである。
2つの動的特徴を持つスパースR-CNNを改善するための2つの動的設計を提案する。
実験により,動的スパースR-CNNと呼ばれる手法は,オブジェクト検出のための異なるバックボーンを持つ強力なスパースR-CNNベースラインを向上できることが示された。
論文 参考訳(メタデータ) (2022-05-04T14:56:25Z) - Spatial-Temporal-Fusion BNN: Variational Bayesian Feature Layer [77.78479877473899]
我々は,BNNを大規模モデルに効率的にスケールするための時空間BNNを設計する。
バニラBNNと比較して,本手法はトレーニング時間とパラメータ数を著しく削減し,BNNのスケールアップに有効である。
論文 参考訳(メタデータ) (2021-12-12T17:13:14Z) - Towards Balanced Learning for Instance Recognition [149.76724446376977]
本稿では,インスタンス認識のためのバランス学習のためのフレームワークであるLibra R-CNNを提案する。
IoUバランスのサンプリング、バランスの取れた特徴ピラミッド、客観的再重み付けをそれぞれ統合し、サンプル、特徴、客観的レベルの不均衡を低減します。
論文 参考訳(メタデータ) (2021-08-23T13:40:45Z) - Towards Overcoming False Positives in Visual Relationship Detection [95.15011997876606]
視覚的関係検出(VRD)における偽陽性率の高い原因について検討する。
本稿では,偽陽性の影響を軽減する堅牢なVRDフレームワークとして,Spatially-Aware Balanced negative pRoposal sAmpling(SABRA)を提案する。
論文 参考訳(メタデータ) (2020-12-23T06:28:00Z) - Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors [36.56528603807598]
そこで,各重み行列はランク1部分空間上の分布のみを含むBNNのランク1パラメータ化を提案する。
また、複数のモードをキャプチャするために、混合近似後続法を用いて再検討し、典型的な混合法とは異なり、この手法はメモリ増加を著しく小さくする。
ImageNetのResNet-50、CIFAR-10/100のWide ResNet 28-10、MIMIC-IIIのRNNでは、ランク1のBNNはログ、精度、キャリブレーションで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-05-14T17:58:59Z) - Bayesian Neural Networks With Maximum Mean Discrepancy Regularization [13.97417198693205]
画像分類タスクを含む複数のベンチマークにおいて,BNNの精度が向上することを示す。
また, ある予測に対する不確実性を推定するための新しい定式化を行い, 敵の攻撃に対してより堅牢な行動を示す。
論文 参考訳(メタデータ) (2020-03-02T14:54:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。