論文の概要: Long-tail Detection with Effective Class-Margins
- arxiv url: http://arxiv.org/abs/2301.09724v1
- Date: Mon, 23 Jan 2023 21:25:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 14:46:22.082683
- Title: Long-tail Detection with Effective Class-Margins
- Title(参考訳): 効果的なクラスマージンを用いたロングテール検出
- Authors: Jang Hyun Cho, Philipp Kr\"ahenb\"uhl
- Abstract要約: 本稿では, 未知のテストセットの平均精度評価基準が, マージンベースの二項分類誤差によってどのように制限されているかを示す。
テキスト・エフェクティブ・クラス・マージン・ロス(ECM)と呼ばれる新しいサロゲート目標を用いて、マージンベースの二項分類誤差を最適化する。
- 参考スコア(独自算出の注目度): 4.18804572788063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale object detection and instance segmentation face a severe data
imbalance. The finer-grained object classes become, the less frequent they
appear in our datasets. However, at test-time, we expect a detector that
performs well for all classes and not just the most frequent ones. In this
paper, we provide a theoretical understanding of the long-trail detection
problem. We show how the commonly used mean average precision evaluation metric
on an unknown test set is bound by a margin-based binary classification error
on a long-tailed object detection training set. We optimize margin-based binary
classification error with a novel surrogate objective called \textbf{Effective
Class-Margin Loss} (ECM). The ECM loss is simple, theoretically well-motivated,
and outperforms other heuristic counterparts on LVIS v1 benchmark over a wide
range of architecture and detectors. Code is available at
\url{https://github.com/janghyuncho/ECM-Loss}.
- Abstract(参考訳): 大規模オブジェクト検出とインスタンスセグメンテーションは、厳しいデータ不均衡に直面します。
粒度の細かいオブジェクトクラスは、データセットに現れる頻度を少なくします。
しかし、テスト時には、最も頻繁なクラスだけでなく、すべてのクラスでうまく機能する検出器が期待されます。
本稿では, 長絡検出問題の理論的理解について述べる。
未知のテストセットにおける平均平均精度評価基準が,長尾の物体検出訓練セットにおけるマージンに基づくバイナリ分類誤差とどのように結びついているかを示す。
マージンに基づくバイナリ分類の誤差を,新たなサロゲート目標である \textbf{ effective class-margin loss} (ecm) を用いて最適化する。
ECMの損失は単純で理論上よく動機付けられており、LVIS v1ベンチマークにおける他のヒューリスティックな結果よりも幅広いアーキテクチャや検出器で優れている。
コードは \url{https://github.com/janghyuncho/ecm-loss} で入手できる。
関連論文リスト
- Towards Long-Tailed 3D Detection [56.82185415482943]
本研究では,Long-Tailed 3D Detection (LT3D) の課題について検討した。
私たちは、CenterPointやPointPillarsといった一般的な3D検出に適応し、LT3Dに適応します。
各クラスの平均APは5%改善し,レアクラスのAPは劇的に改善した。
論文 参考訳(メタデータ) (2022-11-16T06:00:47Z) - Long-tailed Instance Segmentation using Gumbel Optimized Loss [29.240427080642]
我々は,Gumbel Optimized Loss (GOL) 法を開発した。
GOLはAPの1.1%で最高の最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-07-22T08:20:23Z) - Class-Agnostic Segmentation Loss and Its Application to Salient Object
Detection and Segmentation [17.149364927872014]
そこで我々はCAS(class-agnostic segmentation)ロスと呼ばれる新しい損失関数を提案する。
CAS損失関数はスパースであり, 有界であり, クラス不均衡に対して頑健であることを示す。
論文 参考訳(メタデータ) (2021-07-16T12:26:31Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Class-Agnostic Segmentation Loss and Its Application to Salient Object
Detection and Segmentation [17.532822703595766]
そこで我々はCAS(class-agnostic segmentation)ロスと呼ばれる新しい損失関数を提案する。
CAS損失関数はスパースであり, 有界であり, クラス不均衡に対して頑健であることを示す。
低忠実度および高忠実度トレーニングデータの2つの設定における最先端手法に対する性能について検討する。
論文 参考訳(メタデータ) (2020-10-28T07:11:15Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - Overcoming Classifier Imbalance for Long-tail Object Detection with
Balanced Group Softmax [88.11979569564427]
本報告では, 長期分布前における最先端モデルの過小評価に関する最初の体系的解析を行う。
本稿では,グループワイドトレーニングを通じて検出フレームワーク内の分類器のバランスをとるための,新しいバランス付きグループソフトマックス(BAGS)モジュールを提案する。
非常に最近の長尾大語彙オブジェクト認識ベンチマークLVISの大規模な実験により,提案したBAGSは検出器の性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2020-06-18T10:24:26Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z) - Frustratingly Simple Few-Shot Object Detection [98.42824677627581]
希少なクラスにおける既存検出器の最後の層のみを微調整することは、数発の物体検出タスクに不可欠である。
このような単純なアプローチは、現在のベンチマークで約220ポイントのメタ学習方法より優れている。
論文 参考訳(メタデータ) (2020-03-16T00:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。