論文の概要: RecursiveDet: End-to-End Region-based Recursive Object Detection
- arxiv url: http://arxiv.org/abs/2307.13619v1
- Date: Tue, 25 Jul 2023 16:22:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 16:21:17.655880
- Title: RecursiveDet: End-to-End Region-based Recursive Object Detection
- Title(参考訳): RecursiveDet: エンドツーエンドの領域ベース再帰オブジェクト検出
- Authors: Jing Zhao, Li Sun, Qingli Li
- Abstract要約: Sparse R-CNNのような領域ベースのオブジェクト検出器は通常、複数のカスケード境界ボックスデコードステージを持つ。
本稿では,復号段階の一般的な設定は実際には冗長であることを示す。
RecusiveDetは、より少ないモデルパラメータで明らかなパフォーマンス向上を達成することができる。
- 参考スコア(独自算出の注目度): 19.799892459080485
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end region-based object detectors like Sparse R-CNN usually have
multiple cascade bounding box decoding stages, which refine the current
predictions according to their previous results. Model parameters within each
stage are independent, evolving a huge cost. In this paper, we find the general
setting of decoding stages is actually redundant. By simply sharing parameters
and making a recursive decoder, the detector already obtains a significant
improvement. The recursive decoder can be further enhanced by positional
encoding (PE) of the proposal box, which makes it aware of the exact locations
and sizes of input bounding boxes, thus becoming adaptive to proposals from
different stages during the recursion. Moreover, we also design
centerness-based PE to distinguish the RoI feature element and dynamic
convolution kernels at different positions within the bounding box. To validate
the effectiveness of the proposed method, we conduct intensive ablations and
build the full model on three recent mainstream region-based detectors. The
RecusiveDet is able to achieve obvious performance boosts with even fewer model
parameters and slightly increased computation cost. Codes are available at
https://github.com/bravezzzzzz/RecursiveDet.
- Abstract(参考訳): Sparse R-CNNのようなエンドツーエンドの領域ベースのオブジェクト検出器は、通常複数のカスケード境界ボックスデコードステージを持ち、その結果に応じて現在の予測を洗練させる。
各ステージのモデルパラメータは独立しており、膨大なコストがかかります。
本稿では,デコードステージの一般設定は実際には冗長であることを示す。
パラメータを単純に共有して再帰デコーダを作成することで、検出器はすでに大幅に改善されている。
再帰デコーダは提案ボックスの位置符号化(PE)によりさらに拡張され、入力バウンディングボックスの正確な位置とサイズを認識でき、再帰の間、異なる段階の提案に適応する。
さらに,ロI特徴要素と動的畳み込みカーネルをバウンディングボックス内の異なる位置で区別するために,中心性に基づくPEを設計する。
提案手法の有効性を検証するために, 集中アブレーションを行い, 最近の3つの主流領域検出器を用いたフルモデルを構築した。
recusivedetは、モデルパラメータがさらに少なく、計算コストがわずかに増加することで、明らかなパフォーマンス向上を実現することができる。
コードはhttps://github.com/bravezzzzzz/recursivedetで入手できる。
関連論文リスト
- CPR++: Object Localization via Single Coarse Point Supervision [55.8671776333499]
粗い点修正(CPR)は、アルゴリズムの観点からの意味的分散を緩和する最初の試みである。
CPRは、アノテートされた最初のポイントを置き換えるために、近隣地域のセマンティックセンターポイントを選択することで意味のばらつきを減らす。
CPR++は、スケール情報を取得し、グローバル領域における意味的分散をさらに低減することができる。
論文 参考訳(メタデータ) (2024-01-30T17:38:48Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - One-Pass Learning via Bridging Orthogonal Gradient Descent and Recursive
Least-Squares [8.443742714362521]
我々は,従来のデータポイントの予測にほとんど変化しない方向にパラメータを変更しながら,すべての新しいデータポイントに完全に適合するワンパス学習アルゴリズムを開発した。
我々のアルゴリズムは、インクリメンタル・プリンシパル・コンポーネント分析(IPCA)を用いてストリーミングデータの構造を利用して、メモリを効率的に利用する。
本実験では,提案手法の有効性をベースラインと比較した。
論文 参考訳(メタデータ) (2022-07-28T02:01:31Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - Adaptive Recursive Circle Framework for Fine-grained Action Recognition [95.51097674917851]
ビデオにおける微粒な空間時間ダイナミクスのモデル化は、アクション認識にとって難しい問題である。
既存のほとんどのメソッドは、純粋なフィードフォワード方式でレイヤの特徴を生成する。
本稿では,純粋なフィードフォワード層のための微細なデコレータであるAdaptive Recursive Circleフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-25T14:24:29Z) - Omni-supervised Point Cloud Segmentation via Gradual Receptive Field
Component Reasoning [41.83979510282989]
提案した RFCR (Receptive Field Component Reasoning) を通したクラウドセグメンテーションに,最初のオムニスケール監視手法を導入する。
提案手法は,S3DIS と Semantic3D に対して新たな最先端性能を実現し,ScanNet ベンチマークの1位にランクインする。
論文 参考訳(メタデータ) (2021-05-21T08:32:02Z) - Recursively Refined R-CNN: Instance Segmentation with Self-RoI
Rebalancing [2.4634850020708616]
本稿では,ループ機構を導入することで重複を回避するR-CNN(R3$-CNN)を提案する。
実験では,重みのループ機構の特定のエンコーディングに注目し,推論時に使用する必要がある。
このアーキテクチャは、最近提案されたHTCモデルを超えることができ、パラメータの数を著しく削減できる。
論文 参考訳(メタデータ) (2021-04-03T07:25:33Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - Fibonacci and k-Subsecting Recursive Feature Elimination [2.741266294612776]
特徴選択は、分類アルゴリズムを高速化する可能性のあるデータマイニングタスクである。
本稿では、Fibonacciとk-Subsecting Recursive Feature Eliminationという2つの新しいアルゴリズムを提案する。
その結果、Fibonacci と k-Subsecting Recursive Feature Elimination は標準 RFE よりもはるかに高速に機能の小さなサブセットを選択することができることがわかった。
論文 参考訳(メタデータ) (2020-07-29T15:53:04Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。