論文の概要: PBRnet: Pyramidal Bounding Box Refinement to Improve Object Localization
Accuracy
- arxiv url: http://arxiv.org/abs/2003.04541v1
- Date: Tue, 10 Mar 2020 05:27:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 21:13:48.332816
- Title: PBRnet: Pyramidal Bounding Box Refinement to Improve Object Localization
Accuracy
- Title(参考訳): PBRnet: 物体位置決め精度を向上させるためのピラミッド境界ボックスリファインメント
- Authors: Li Xiao, Yufan Luo, Chunlong Luo, Lianhe Zhao, Quanshui Fu, Guoqing
Yang, Anpeng Huang, Yi Zhao
- Abstract要約: 我々は、位置化精度を向上させるために、新しい境界改善アーキテクチャを設計する。
PBRnet(Maraamidal Bounding Box Refinement Network)と呼ばれる,粗粒度フレームワークと特徴ピラミッド構造を組み合わせる。
PBRnetは、FPNやLibra R-CNNに追加すると、約3ポイントのmAP$が大幅に向上する。
- 参考スコア(独自算出の注目度): 6.775139104574919
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many recently developed object detectors focused on coarse-to-fine framework
which contains several stages that classify and regress proposals from
coarse-grain to fine-grain, and obtains more accurate detection gradually.
Multi-resolution models such as Feature Pyramid Network(FPN) integrate
information of different levels of resolution and effectively improve the
performance. Previous researches also have revealed that localization can be
further improved by: 1) using fine-grained information which is more
translational variant; 2) refining local areas which is more focused on local
boundary information. Based on these principles, we designed a novel boundary
refinement architecture to improve localization accuracy by combining
coarse-to-fine framework with feature pyramid structure, named as Pyramidal
Bounding Box Refinement network(PBRnet), which parameterizes gradually focused
boundary areas of objects and leverages lower-level feature maps to extract
finer local information when refining the predicted bounding boxes. Extensive
experiments are performed on the MS-COCO dataset. The PBRnet brings a
significant performance gains by roughly 3 point of $mAP$ when added to FPN or
Libra R-CNN. Moreover, by treating Cascade R-CNN as a coarse-to-fine detector
and replacing its localization branch by the regressor of PBRnet, it leads an
extra performance improvement by 1.5 $mAP$, yielding a total performance
boosting by as high as 5 point of $mAP$.
- Abstract(参考訳): 近年,粗粒から微粒までの提案を分類・回帰する段階を数段階含む粗粒度フレームワークに着目した物体検出装置が多数開発され,より高精度な検出が徐々に実現されている。
特徴ピラミッドネットワーク(FPN)のようなマルチレゾリューションモデルは、異なる解像度の情報を統合し、性能を効果的に改善する。
以前の研究でも、ローカライゼーションをさらに改善できることが判明している。
1) より翻訳的な変種であるきめ細かい情報を使用すること
2)地域境界情報により焦点を絞った地域を精錬する。
これらの原理に基づき、我々は、粗粒度フレームワークとピラミッド境界箱微細化ネットワーク(PBRnet)という特徴ピラミッド構造を組み合わせることにより、局所化精度を向上させるために、新しい境界改善アーキテクチャを設計した。
大規模な実験はMS-COCOデータセット上で行われる。
PBRnetは、FPNやLibra R-CNNに追加すると、約3ポイントのmAP$が大幅に向上する。
さらに、カスケードR-CNNを粗大な検出器として扱い、PBRnetの回帰器によってローカライゼーションブランチを置き換えることで、1.5$mAP$の余分な性能向上を実現し、最大5ポイントのmAP$まで性能が向上する。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Point Tree Transformer for Point Cloud Registration [33.00645881490638]
ポイントクラウド登録は、コンピュータビジョンとロボティクスの分野における基本的なタスクである。
本稿では,局所的特徴とグローバルな特徴を効率的に抽出する,ポイントクラウド登録のためのトランスフォーマーベースの新しいアプローチを提案する。
本手法は最先端の手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2024-06-25T13:14:26Z) - PotholeGuard: A Pothole Detection Approach by Point Cloud Semantic
Segmentation [0.0]
3Dセマンティック・ポトホールの研究は、しばしば点雲の空間性を見落とし、最適な局所的な特徴のキャプチャとセグメンテーションの精度をもたらす。
本モデルでは,隠れた特徴を効率よく同定し,局所特性を高めるためにフィードバック機構を用いる。
弊社のアプローチは、堅牢で正確な3Dポットホールセグメンテーション(pothole segmentation)のための有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-11-05T12:57:05Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - Shapley-NAS: Discovering Operation Contribution for Neural Architecture
Search [96.20505710087392]
ニューラルアーキテクチャ探索のための演算寄与度(Shapley-NAS)を評価するためのShapley値に基づく手法を提案する。
提案手法は,光探索コストに比例して最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-20T14:41:49Z) - PAPooling: Graph-based Position Adaptive Aggregation of Local Geometry
in Point Clouds [15.878533142927102]
PaPoolingは、新しいグラフ表現を用いて局所点間の空間関係を明示的にモデル化する。
位置適応的な方法で特徴を集約し、集約された特徴の位置感応的な表現を可能にする。
計算オーバーヘッドを最小限に抑えながら、予測精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-11-28T07:26:55Z) - $P^2$ Net: Augmented Parallel-Pyramid Net for Attention Guided Pose
Estimation [69.25492391672064]
拡張ボトルネックとアテンションモジュールによる特徴改善を施したパラレルピラミドネットを提案する。
並列ピラミド構造は、ネットワークによって導入された情報損失を補うために続く。
提案手法は, MSCOCO と MPII のデータセットにおいて, 最適な性能を実現する。
論文 参考訳(メタデータ) (2020-10-26T02:10:12Z) - Weakly Supervised Attention Pyramid Convolutional Neural Network for
Fine-Grained Visual Classification [71.96618723152487]
注意ピラミッド畳み込みニューラルネットワーク(AP-CNN)について紹介する。
AP-CNNは高レベルのセマンティックと低レベルの詳細な特徴表現の両方を学ぶ。
追加のバウンディングボックス/パートアノテーションを必要とせずに、エンドツーエンドでトレーニングすることができる。
論文 参考訳(メタデータ) (2020-02-09T12:33:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。