論文の概要: Revisiting Proposal-based Object Detection
- arxiv url: http://arxiv.org/abs/2311.18512v1
- Date: Thu, 30 Nov 2023 12:40:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-01 16:45:41.418919
- Title: Revisiting Proposal-based Object Detection
- Title(参考訳): 提案に基づくオブジェクト検出の再検討
- Authors: Aritra Bhowmik, Martin R. Oswald, Pascal Mettes, Cees G. M. Snoek
- Abstract要約: 提案手法により画像中の物体を検出するパイプラインを再検討する。
我々は提案と根拠的真理の交わりの領域に回帰する単純な問題を解決する。
私たちの再検討されたアプローチは、検出パイプラインの変更を最小限にして、既存のメソッドにプラグインすることができます。
- 参考スコア(独自算出の注目度): 59.97295544455179
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper revisits the pipeline for detecting objects in images with
proposals. For any object detector, the obtained box proposals or queries need
to be classified and regressed towards ground truth boxes. The common solution
for the final predictions is to directly maximize the overlap between each
proposal and the ground truth box, followed by a winner-takes-all ranking or
non-maximum suppression. In this work, we propose a simple yet effective
alternative. For proposal regression, we solve a simpler problem where we
regress to the area of intersection between proposal and ground truth. In this
way, each proposal only specifies which part contains the object, avoiding a
blind inpainting problem where proposals need to be regressed beyond their
visual scope. In turn, we replace the winner-takes-all strategy and obtain the
final prediction by taking the union over the regressed intersections of a
proposal group surrounding an object. Our revisited approach comes with minimal
changes to the detection pipeline and can be plugged into any existing method.
We show that our approach directly improves canonical object detection and
instance segmentation architectures, highlighting the utility of
intersection-based regression and grouping.
- Abstract(参考訳): 本稿では,画像中の物体を検出するパイプラインについて提案する。
任意のオブジェクト検出器では、取得したボックスの提案やクエリを分類して、真理のボックスに回帰する必要がある。
最終的な予測に対する一般的な解決策は、各提案と基底の真理箱の重なりを直接最大化し、その後に勝者全員のランキングまたは最大でない抑圧を行うことである。
本稿では,単純かつ効果的な代替案を提案する。
提案の回帰は,提案と基礎的真理の交わりの領域に回帰する,より単純な問題を解く。
このように、各プロポーザルはオブジェクトを含む部分のみを指定し、プロポーザルが視覚的スコープを超えて回帰する必要がある盲点の塗装問題を避ける。
そこで本研究では, 対象を囲む提案群の回帰的交点をユニオンに乗じて, 勝敗戦略を置き換え, 最終的な予測値を得る。
再訪したアプローチでは、検出パイプラインの変更が最小限に抑えられ、既存のメソッドにプラグインすることができます。
このアプローチは,標準オブジェクト検出とインスタンスセグメンテーションアーキテクチャを直接改善し,交差型回帰とグループ化の有用性を強調する。
関連論文リスト
- See, Say, and Segment: Teaching LMMs to Overcome False Premises [67.36381001664635]
この課題を解決するために,LMMのカスケードと共同学習手法を提案する。
得られたモデルでは、画像中に物体が存在するかどうかを検知し、その物体が存在しないかをユーザに「例」し、最終的に、対象物のマスクを出力することで「分類」を行う。
論文 参考訳(メタデータ) (2023-12-13T18:58:04Z) - Domain Generalization via Rationale Invariance [70.32415695574555]
本稿では,未確認環境においてもロバストな結果の維持を伴う領域一般化の課題を緩和する新たな視点を提供する。
本稿では,最終結果に対する要素的貢献を決定の根拠として扱い,各試料の根拠を行列として表現することを提案する。
提案手法は, 単純性に拘わらず, 様々なデータセット間で競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2023-08-22T03:31:40Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - Which to Match? Selecting Consistent GT-Proposal Assignment for
Pedestrian Detection [23.92066492219922]
IoU(Universal Intersection over Union)ベースの割り当て-回帰方式は依然としてパフォーマンスを制限している。
新しい割り当てと回帰メトリックとして、1つの幾何学的敏感検索アルゴリズムを紹介します。
具体的には、MR-FPPIをR$_75$で8.8%向上させます。
論文 参考訳(メタデータ) (2021-03-18T08:54:51Z) - Iterative Shrinking for Referring Expression Grounding Using Deep
Reinforcement Learning [20.23920009396818]
我々は,問合せ文に従って対象オブジェクトをローカライズすることを目的とした,提案なし参照表現基底化タスクに取り組んでいる。
既存のプロポーザルフリー手法では、クエリ画像マッチングブランチを使用して、画像特徴マップの最高スコアをターゲットボックスセンターとして選択する。
対象を局所化するための反復的縮小機構を提案し,強化学習エージェントによって縮小方向が決定される。
論文 参考訳(メタデータ) (2021-03-09T02:36:45Z) - Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty
Regularization [73.03956876752868]
我々は、ネットワークがオブジェクトの他の部分に注意を払うことを可能にする、原則的でエンドツーエンドのトレーニング可能なフレームワークを提案する。
具体的には、ミックスアップデータ拡張方式を分類ネットワークに導入し、2つの不確実な正規化項を設計し、ミックスアップ戦略をよりよく扱う。
論文 参考訳(メタデータ) (2020-08-03T21:19:08Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z) - Proposal Learning for Semi-Supervised Object Detection [76.83284279733722]
地上の真理ラベルが利用できないため、ラベルのないデータで物体検出器を訓練するのは簡単ではない。
ラベル付きデータとラベルなしデータの両方から提案特徴と予測を学習するための提案学習手法を提案する。
論文 参考訳(メタデータ) (2020-01-15T00:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。