論文の概要: OCDet: Object Center Detection via Bounding Box-Aware Heatmap Prediction on Edge Devices with NPUs
- arxiv url: http://arxiv.org/abs/2411.15653v1
- Date: Sat, 23 Nov 2024 21:17:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:21:01.970780
- Title: OCDet: Object Center Detection via Bounding Box-Aware Heatmap Prediction on Edge Devices with NPUs
- Title(参考訳): OCDet: NPUを用いたエッジデバイス上でのバウンディングボックス対応ヒートマップ予測によるオブジェクトセンター検出
- Authors: Chen Xin, Thomas Motz, Andreas Hartel, Enkelejda Kasneci,
- Abstract要約: OCDetは、NPUを使ったエッジデバイス向けに最適化された軽量なObject Center Detectionフレームワークである。
OCDetは、オブジェクト中心の確率を表すヒートマップを予測し、ピーク識別を通じて中心点を抽出する。
NPUフレンドリーなセマンティックFPNとMobileNetV4のバックボーンで構築されたOCDetモデルは、当社のBa balanced Continuous Focal Loss (BCFL)によってトレーニングされています。
- 参考スコア(独自算出の注目度): 7.969347737723115
- License:
- Abstract: Real-time object localization on edge devices is fundamental for numerous applications, ranging from surveillance to industrial automation. Traditional frameworks, such as object detection, segmentation, and keypoint detection, struggle in resource-constrained environments, often resulting in substantial target omissions. To address these challenges, we introduce OCDet, a lightweight Object Center Detection framework optimized for edge devices with NPUs. OCDet predicts heatmaps representing object center probabilities and extracts center points through peak identification. Unlike prior methods using fixed Gaussian distribution, we introduce Generalized Centerness (GC) to generate ground truth heatmaps from bounding box annotations, providing finer spatial details without additional manual labeling. Built on NPU-friendly Semantic FPN with MobileNetV4 backbones, OCDet models are trained by our Balanced Continuous Focal Loss (BCFL), which alleviates data imbalance and focuses training on hard negative examples for probability regression tasks. Leveraging the novel Center Alignment Score (CAS) with Hungarian matching, we demonstrate that OCDet consistently outperforms YOLO11 in object center detection, achieving up to 23% higher CAS while requiring 42% fewer parameters, 34% less computation, and 64% lower NPU latency. When compared to keypoint detection frameworks, OCDet achieves substantial CAS improvements up to 186% using identical models. By integrating GC, BCFL, and CAS, OCDet establishes a new paradigm for efficient and robust object center detection on edge devices with NPUs. The code is released at https://github.com/chen-xin-94/ocdet.
- Abstract(参考訳): エッジデバイス上でのリアルタイムオブジェクトのローカライゼーションは、監視から産業自動化まで、数多くのアプリケーションに基本となる。
オブジェクト検出、セグメンテーション、キーポイント検出といった従来のフレームワークは、リソースに制約のある環境で苦労し、多くの場合、かなりの目標を逸脱する。
これらの課題に対処するため,我々は,NPUを用いたエッジデバイス向けに最適化された軽量なObject Center DetectionフレームワークであるOCDetを紹介した。
OCDetは、オブジェクト中心の確率を表すヒートマップを予測し、ピーク識別を通じて中心点を抽出する。
固定ガウス分布を用いた従来の手法とは異なり、境界ボックスアノテーションから基底真理熱マップを生成するための一般中心性(GC)を導入し、手動ラベリングを伴わずにより細かな空間的詳細を提供する。
NPUフレンドリーなセマンティックFPNとMobileNetV4のバックボーンで構築されたOCDetモデルは、データ不均衡を緩和し、確率回帰タスクのハードネガティブな例にトレーニングを集中するBa balanced Continuous Focal Loss (BCFL)によってトレーニングされています。
ハンガリーのマッチングを用いた新しいCenter Alignment Score(CAS)を用いて、OCDetはオブジェクト中心検出においてYOLO11を一貫して上回り、最大23%のCASを実現し、パラメータは42%減少し、計算量は34%減少し、NPUレイテンシは64%低下した。
キーポイント検出フレームワークと比較すると、OCDetは同一モデルを使用して最大186%のCAS改善を実現している。
GC、BCFL、CASを統合することで、OCDetは、NPUによるエッジデバイス上での効率的で堅牢なオブジェクトセンター検出のための新しいパラダイムを確立します。
コードはhttps://github.com/chen-xin-94/ocdet.comで公開されている。
関連論文リスト
- Center Focusing Network for Real-Time LiDAR Panoptic Segmentation [58.1194137706868]
高精度かつリアルタイムなLiDARパノプティブセグメンテーションを実現するために、CFNet(Central Focus Network)を導入した。
CFFEは、元のLiDARポイントと仮想インスタンスセンターの関係を明確に理解するために提案されている。
我々のCFNetは、すべての既存のメソッドを大きなマージンで上回り、最も効率的なメソッドよりも1.6倍高速です。
論文 参考訳(メタデータ) (2023-11-16T01:52:11Z) - Feature Selection using Sparse Adaptive Bottleneck Centroid-Encoder [1.2487990897680423]
2つ以上のクラスで識別される特徴を決定するために,新しい非線形モデル SABCE (Sparse Adaptive Bottleneckid-Encoder) を導入する。
このアルゴリズムは、高次元生物学的、画像、音声、加速度センサデータなど、様々な実世界のデータセットに適用される。
論文 参考訳(メタデータ) (2023-06-07T21:37:21Z) - Point-to-Box Network for Accurate Object Detection via Single Point
Supervision [51.95993495703855]
オフ・ザ・シェルフ提案法(OTSP)の軽量な代替手法を提案する。
P2BNetは、アンカーのような方法で提案を生成することで、オブジェクト間のバランスの取れた提案バッグを構築することができる。
コードはCOCO.com/ucas-vg/P2BNetでリリースされる。
論文 参考訳(メタデータ) (2022-07-14T11:32:00Z) - CenterNet++ for Object Detection [174.59360147041673]
ボトムアップアプローチはトップダウンと同じくらい競争力があり、リコールも高くなります。
CenterNetと呼ばれる我々のアプローチは、各オブジェクトを三重項キーポイント(左上と右下)として検出する。
MS-COCOデータセットでは、Res2Net-101 と Swin-Transformer の CenterNet がそれぞれ 53.7% と 57.1% のAPを達成している。
論文 参考訳(メタデータ) (2022-04-18T16:45:53Z) - DAFNe: A One-Stage Anchor-Free Deep Model for Oriented Object Detection [16.21161769128316]
DAFNe: オブジェクト指向物体検出のためのワンステージアンカーフリーディープネットワークを提案する。
アンカーフリーモデルとして、DAFNeはバウンディングボックスアンカーの使用を控えることで予測複雑性を低減する。
低品質な予測に対する任意指向の有界箱に対する中心性関数の指向性を考慮した一般化を提案する。
論文 参考訳(メタデータ) (2021-09-13T17:37:20Z) - Corner Proposal Network for Anchor-free, Two-stage Object Detection [174.59360147041673]
オブジェクト検出の目標は、画像内のオブジェクトのクラスと位置を決定することである。
本稿では,多数のオブジェクト提案を抽出する新しいアンカーフリー2段階フレームワークを提案する。
この2つの段階が,リコールと精度の向上に有効な解であることを示す。
論文 参考訳(メタデータ) (2020-07-27T19:04:57Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - CenterNet3D: An Anchor Free Object Detector for Point Cloud [14.506796247331584]
本研究では,アンカーフリーのCenterNet3Dネットワークを提案し,アンカーなしで3次元物体検出を行う。
中心点に基づいて,アンカー不要な3次元物体検出を行うCenterNet3Dネットワークを提案する。
提案手法は,最先端のアンカーベースの一段法よりも優れ,二段法に匹敵する性能を有する。
論文 参考訳(メタデータ) (2020-07-13T13:53:56Z) - FCOS: A simple and strong anchor-free object detector [111.87691210818194]
物体検出を画素ごとの予測方式で解くために, 完全畳み込み型一段物検出器 (FCOS) を提案する。
RetinaNet、SSD、YOLOv3、Faster R-CNNといった最先端のオブジェクト検出器のほとんどは、事前に定義されたアンカーボックスに依存している。
対照的に、提案した検出器FCOSはアンカーボックスフリーであり、提案はフリーである。
論文 参考訳(メタデータ) (2020-06-14T01:03:39Z) - CentripetalNet: Pursuing High-quality Keypoint Pairs for Object
Detection [20.86058667479973]
本稿では,CentripetalNetを提案する。このCentripetalNetは,Centripetalシフトを用いて,同じインスタンスからコーナーキーポイントをペアリングする。
CentripetalNetは、コーナーポイントの位置と中心シフトを予測し、シフトした結果が一致したコーナーにマッチする。
MS-COCOテストデブでは、CentripetalNetは既存のアンカーフリー検出器を48.0%のAPで上回るだけでなく、40.2%のMaskAPで最先端のインスタンスセグメンテーションアプローチと同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-03-20T06:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。