論文の概要: RMOPP: Robust Multi-Objective Post-Processing for Effective Object
Detection
- arxiv url: http://arxiv.org/abs/2102.04582v1
- Date: Tue, 9 Feb 2021 00:02:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-10 15:14:36.577936
- Title: RMOPP: Robust Multi-Objective Post-Processing for Effective Object
Detection
- Title(参考訳): RMOPP: 効果的なオブジェクト検出のためのロバストな多目的後処理
- Authors: Mayuresh Savargaonkar, Abdallah Chehade and Samir Rawashdeh
- Abstract要約: RMOPPは統計的に駆動された後処理アルゴリズムであり、精度とリコールの同時最適化を可能にする。
MS-COCOデータセットを用いて、YOLOv2上で魅力的なテストケースを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the last few decades, many architectures have been developed that
harness the power of neural networks to detect objects in near real-time.
Training such systems requires substantial time across multiple GPUs and
massive labeled training datasets. Although the goal of these systems is
generalizability, they are often impractical in real-life applications due to
flexibility, robustness, or speed issues. This paper proposes RMOPP: A robust
multi-objective post-processing algorithm to boost the performance of fast
pre-trained object detectors with a negligible impact on their speed.
Specifically, RMOPP is a statistically driven, post-processing algorithm that
allows for simultaneous optimization of precision and recall. A unique feature
of RMOPP is the Pareto frontier that identifies dominant possible
post-processed detectors to optimize for both precision and recall. RMOPP
explores the full potential of a pre-trained object detector and is deployable
for near real-time predictions. We also provide a compelling test case on
YOLOv2 using the MS-COCO dataset.
- Abstract(参考訳): 過去数十年間、ニューラルネットワークの力を利用して物体をほぼリアルタイムで検出する多くのアーキテクチャが開発されてきた。
このようなシステムのトレーニングには、複数のGPUと大量のラベル付きトレーニングデータセットにかなりの時間を要する。
これらのシステムの目標は汎用性であるが、柔軟性、堅牢性、スピードの問題などにより、現実のアプリケーションでは実用的でないことが多い。
本稿では,RMOPPを提案する: 高速な事前学習対象検出器の性能を高速に向上する,頑健な多目的後処理アルゴリズムを提案する。
特に、rmoppは、精度とリコールの同時最適化を可能にする統計駆動後処理アルゴリズムである。
RMOPPのユニークな特徴は、精度とリコールの両方を最適化するために支配的な後処理検出器を識別するParetoフロンティアです。
RMOPPは、事前訓練された物体検出器の完全なポテンシャルを探索し、ほぼリアルタイムで予測できる。
また、MS-COCOデータセットを用いてYOLOv2上で魅力的なテストケースを提供する。
関連論文リスト
- Fast-COS: A Fast One-Stage Object Detector Based on Reparameterized Attention Vision Transformer for Autonomous Driving [3.617580194719686]
本稿では、シーンを駆動するための新しい単一ステージオブジェクト検出フレームワークであるFast-COSを紹介する。
RAViTはImageNet-1Kデータセットで81.4%のTop-1精度を達成した。
主要なモデルの効率を上回り、最大75.9%のGPU推論速度とエッジデバイスでの1.38のスループットを提供する。
論文 参考訳(メタデータ) (2025-02-11T09:54:09Z) - RE-POSE: Synergizing Reinforcement Learning-Based Partitioning and Offloading for Edge Object Detection [3.2805151494259563]
エッジデバイス上でのリアルタイムオブジェクト検出は、その限られた計算リソースと、ディープニューラルネットワーク(DNN)ベースの検出モデルの高要求により、大きな課題を呈している。
本稿では,リソース制約のあるエッジ環境における精度-遅延トレードオフを最適化するフレームワークであるRE-POSEを紹介する。
論文 参考訳(メタデータ) (2025-01-16T10:56:45Z) - CorrDiff: Adaptive Delay-aware Detector with Temporal Cue Inputs for Real-time Object Detection [11.714072240331518]
CorrDiffは、リアルタイム検出システムの遅延問題に対処するために設計された。
複数の将来のフレームに対するオブジェクトの位置を予測するために、実行時推定の時間的キューを利用することができる。
あらゆる種類のデバイスにおいて、厳格なリアルタイム処理要件を満たす。
論文 参考訳(メタデータ) (2025-01-09T10:34:25Z) - SpikeMOT: Event-based Multi-Object Tracking with Sparse Motion Features [52.213656737672935]
SpikeMOTはイベントベースのマルチオブジェクトトラッカーである。
SpikeMOTはスパイクニューラルネットワークを使用して、オブジェクトに関連するイベントストリームからスパーステンポラルな特徴を抽出する。
論文 参考訳(メタデータ) (2023-09-29T05:13:43Z) - Let's Roll: Synthetic Dataset Analysis for Pedestrian Detection Across
Different Shutter Types [7.0441427250832644]
本稿では,機械学習(ML)オブジェクト検出モデルに異なるシャッター機構が与える影響について検討する。
特に、合成合成されたGSとRSのデータセットを用いて、主流検出モデルを訓練し、評価する。
論文 参考訳(メタデータ) (2023-09-15T04:07:42Z) - Using Detection, Tracking and Prediction in Visual SLAM to Achieve
Real-time Semantic Mapping of Dynamic Scenarios [70.70421502784598]
RDS-SLAMは、一般的に使用されているIntel Core i7 CPUのみを使用して、動的シナリオのためのオブジェクトレベルでのセマンティックマップをリアルタイムで構築することができる。
我々は, TUM RGB-DデータセットにおけるRDS-SLAMを評価し, 動的シナリオにおいて, RDS-SLAMはフレームあたり30.3msで動作可能であることを示した。
論文 参考訳(メタデータ) (2022-10-10T11:03:32Z) - Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文 参考訳(メタデータ) (2022-01-13T15:20:45Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z) - Fast Region Proposal Learning for Object Detection for Robotics [21.48920421574167]
本稿では,ディープラーニング記述子の強力な表現を活用するアーキテクチャを提案する。
本稿では,タスクの領域候補生成に加えて,適用によってさらに精度が向上できることを実証する。
論文 参考訳(メタデータ) (2020-11-25T14:51:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。