論文の概要: Should All Proposals be Treated Equally in Object Detection?
- arxiv url: http://arxiv.org/abs/2207.03520v1
- Date: Thu, 7 Jul 2022 18:26:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-15 10:14:09.679948
- Title: Should All Proposals be Treated Equally in Object Detection?
- Title(参考訳): すべての提案は、オブジェクト検出で等しく扱うべきか?
- Authors: Yunsheng Li, Yinpeng Chen, Xiyang Dai, Dongdong Chen, Mengchen Liu,
Pei Yu, Jing Yin, Lu Yuan, Zicheng Liu, Nuno Vasconcelos
- Abstract要約: オブジェクト検出器の複雑さと精度のトレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。
検出効率の改善には、提案の不平等な処理に向けて、パラダイムシフトが必要であると仮定されている。
これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
- 参考スコア(独自算出の注目度): 110.27485090952385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The complexity-precision trade-off of an object detector is a critical
problem for resource constrained vision tasks. Previous works have emphasized
detectors implemented with efficient backbones. The impact on this trade-off of
proposal processing by the detection head is investigated in this work. It is
hypothesized that improved detection efficiency requires a paradigm shift,
towards the unequal processing of proposals, assigning more computation to good
proposals than poor ones. This results in better utilization of available
computational budget, enabling higher accuracy for the same FLOPS. We formulate
this as a learning problem where the goal is to assign operators to proposals,
in the detection head, so that the total computational cost is constrained and
the precision is maximized. The key finding is that such matching can be
learned as a function that maps each proposal embedding into a one-hot code
over operators. While this function induces a complex dynamic network routing
mechanism, it can be implemented by a simple MLP and learned end-to-end with
off-the-shelf object detectors. This 'dynamic proposal processing' (DPP) is
shown to outperform state-of-the-art end-to-end object detectors (DETR, Sparse
R-CNN) by a clear margin for a given computational complexity.
- Abstract(参考訳): オブジェクト検出器の複雑性-精度トレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。
以前の研究では、効率的なバックボーンで実装された検出器を強調している。
本研究は,検出ヘッドによる提案処理のトレードオフに対する影響について検討する。
検出効率の改善は、提案の不平等な処理に向けてパラダイムシフトを必要とし、貧弱な提案よりも良い提案により多くの計算を割り当てる、という仮説が立てられている。
これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
我々は,演算子を検出ヘッドに割り当てることが目的である学習問題としてこれを定式化し,演算子の総計算コストを制約し,精度を最大化する。
鍵となる発見は、そのようなマッチングは各提案を演算子上の1つのホットコードにマッピングする関数として学習できるということである。
この関数は複雑な動的ネットワークルーティング機構を誘導するが、単純なMLPで実装でき、既製の物体検出器でエンドツーエンドに学習することができる。
この「動的プロポーザル処理」(DPP)は、与えられた計算複雑性に対して明確なマージンで最先端のオブジェクト検出器(DETR, Sparse R-CNN)より優れていることを示す。
関連論文リスト
- An Algorithm and Complexity Results for Causal Unit Selection [16.307996243413967]
単位選択問題は、刺激を受ける際に望ましい振る舞いを示す可能性が最も高い、単位と呼ばれる物体を特定することを目的としている。
本稿では,幅広い因果的目的関数のクラスと完全に定義された構造因果的モデルに与えられた最適単位を求めるための,最初の正確なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-28T08:46:51Z) - Transformer-based assignment decision network for multiple object
tracking [0.0]
本稿では,データアソシエーションに取り組むトランスフォーマーベースのアサインメント決定ネットワーク(TADN)について,推論中に明示的な最適化を必要とせずに紹介する。
提案手法は,トラッカーとしての単純な性質にもかかわらず,ほとんどの評価指標において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-08-06T19:47:32Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - NoisyCUR: An algorithm for two-cost budgeted matrix completion [13.094997642327371]
matrix completionは、機械学習とデータ分析のユビキタスなツールだ。
この設定のための回帰ベースの補完アルゴリズムを紹介します。
我々は,合成データと実データの両方における手法の性能を実験的に検証した。
論文 参考訳(メタデータ) (2021-04-16T10:39:56Z) - AmphibianDetector: adaptive computation for moving objects detection [0.913755431537592]
本稿では,偽陽性検出の回数を減らすためのオブジェクト検出手法を提案する。
提案手法は、すでにオブジェクト検出タスクのために訓練されているCNNの修正である。
提案手法の有効性をオープンデータセット"CDNet2014 pedestrian"で実証した。
論文 参考訳(メタデータ) (2020-11-15T12:37:44Z) - Global Optimization of Objective Functions Represented by ReLU Networks [77.55969359556032]
ニューラルネットワークは複雑で非敵対的な関数を学ぶことができ、安全クリティカルな文脈でそれらの正しい振る舞いを保証することは困難である。
ネットワーク内の障害を見つけるための多くのアプローチ(例えば、敵の例)があるが、これらは障害の欠如を保証できない。
本稿では,最適化プロセスを検証手順に統合し,本手法よりも優れた性能を実現する手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T08:19:48Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。