論文の概要: PS-RCNN: Detecting Secondary Human Instances in a Crowd via Primary
Object Suppression
- arxiv url: http://arxiv.org/abs/2003.07080v1
- Date: Mon, 16 Mar 2020 09:03:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 03:04:08.095652
- Title: PS-RCNN: Detecting Secondary Human Instances in a Crowd via Primary
Object Suppression
- Title(参考訳): PS-RCNN:プライマリ・オブジェクト・サプレッションによる集団における二次的ヒューマン・インスタンスの検出
- Authors: Zheng Ge, Zequn Jie, Xin Huang, Rong Xu and Osamu Yoshie
- Abstract要約: 我々はPS-RCNNと呼ばれる2段階検出器の変種を紹介する。
PS-RCNNは、まずR-CNNモジュールによって、わずか/1個の隠蔽オブジェクトを検出する。
そして、検出されたインスタンスを人間の形のマスクで抑制し、密閉されたインスタンスの特徴を際立たせる。
- 参考スコア(独自算出の注目度): 23.435009411293777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting human bodies in highly crowded scenes is a challenging problem. Two
main reasons result in such a problem: 1). weak visual cues of heavily occluded
instances can hardly provide sufficient information for accurate detection; 2).
heavily occluded instances are easier to be suppressed by
Non-Maximum-Suppression (NMS). To address these two issues, we introduce a
variant of two-stage detectors called PS-RCNN. PS-RCNN first detects
slightly/none occluded objects by an R-CNN module (referred as P-RCNN), and
then suppress the detected instances by human-shaped masks so that the features
of heavily occluded instances can stand out. After that, PS-RCNN utilizes
another R-CNN module specialized in heavily occluded human detection (referred
as S-RCNN) to detect the rest missed objects by P-RCNN. Final results are the
ensemble of the outputs from these two R-CNNs. Moreover, we introduce a High
Resolution RoI Align (HRRA) module to retain as much of fine-grained features
of visible parts of the heavily occluded humans as possible. Our PS-RCNN
significantly improves recall and AP by 4.49% and 2.92% respectively on
CrowdHuman, compared to the baseline. Similar improvements on Widerperson are
also achieved by the PS-RCNN.
- Abstract(参考訳): 混み合った場面で人体を検出することは難しい問題である。
主な理由は2つある: 1)。
密集したインスタンスの弱い視覚的手がかりは、正確な検出に十分な情報を提供できない。
非最大抑制 (nms) により、多くのオクルードインスタンスの抑制が容易である。
これら2つの問題に対処するため,PS-RCNNと呼ばれる2段階検出器を導入している。
PS-RCNNはまず、R-CNNモジュール(P-RCNNと呼ばれる)によってわずかに隠されたオブジェクトを検出し、その検出されたインスタンスを人型マスクによって抑制し、密閉されたインスタンスの特徴を際立たせる。
その後、PS-RCNNは、P-RCNNによって失われた残りのオブジェクトを検出するために、密閉された人間検出(S-RCNN)に特化した別のR-CNNモジュールを使用する。
最終的な結果は、これらの2つのR-CNNからの出力のアンサンブルである。
さらに,高分解能RoI Align (HRRA)モジュールを導入し,高度に閉塞されたヒトの可視部の微細な特徴を可能な限り保持する。
我々のPS-RCNNは、ベースラインと比較して、CrowdHumanでそれぞれ4.49%、APで2.92%改善している。
Widerpersonの同様の改善はPS-RCNNでも達成されている。
関連論文リスト
- GhostRNN: Reducing State Redundancy in RNN with Cheap Operations [66.14054138609355]
本稿では,効率的なRNNアーキテクチャであるGhostRNNを提案する。
KWSとSEタスクの実験により、提案されたGhostRNNはメモリ使用量(40%)と計算コストを大幅に削減し、性能は類似している。
論文 参考訳(メタデータ) (2024-11-20T11:37:14Z) - A Tensor Decomposition Perspective on Second-order RNNs [5.922280687190788]
CPRNNと呼ばれるCP分解を用いた2RNNのパラメータ化モデルについて検討する。
ランクと隠れサイズがモデルキャパシティに与える影響を分析し、これらのパラメータに基づいてRNN, 2RNN, MIRNN, CPRNN間の関係を示す。
これらの結果はPenn Treebankデータセットの実験によって実証的に支援され、固定パラメータ予算により、CPRNNは、RNN、2RNN、MIRNNよりも、適切なランクと隠されたサイズで優れていることを示す。
論文 参考訳(メタデータ) (2024-06-07T16:18:32Z) - Harnessing Neuron Stability to Improve DNN Verification [42.65507402735545]
我々は最近提案されたDPLLベースの制約DNN検証手法の拡張であるVeriStableを提案する。
完全接続型フィードネットワーク(FNN)、畳み込み型ニューラルネットワーク(CNN)、残留型ネットワーク(ResNet)など、さまざまな課題のあるベンチマークにおいてVeriStableの有効性を評価する。
予備的な結果は、VeriStableは、VNN-COMPの第1および第2のパフォーマーである$alpha$-$beta$-CROWNやMN-BaBなど、最先端の検証ツールよりも優れていることを示している。
論文 参考訳(メタデータ) (2024-01-19T23:48:04Z) - Dynamics-Aware Loss for Learning with Label Noise [73.75129479936302]
ディープニューラルネットワーク(DNN)にラベルノイズが深刻な脅威をもたらす
本稿では,この問題を解決するためにDAL(Dynamics-Aware Los)を提案する。
詳細な理論的解析と広範な実験結果の両方が,本手法の優位性を示している。
論文 参考訳(メタデータ) (2023-03-21T03:05:21Z) - OccRob: Efficient SMT-Based Occlusion Robustness Verification of Deep
Neural Networks [7.797299214812479]
Occlusionは、ディープニューラルネットワーク(DNN)に対する一般的かつ容易に実現可能なセマンティック摂動である
DNNを騙していくつかのセグメントを隠蔽することで入力画像を誤分類し、おそらく深刻なエラーを引き起こす可能性がある。
DNNの既存のロバスト性検証アプローチは、非意味的な摂動に重点を置いている。
論文 参考訳(メタデータ) (2023-01-27T18:54:00Z) - Training High-Performance Low-Latency Spiking Neural Networks by
Differentiation on Spike Representation [70.75043144299168]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上に実装された場合、有望なエネルギー効率のAIモデルである。
非分化性のため、SNNを効率的に訓練することは困難である。
本稿では,ハイパフォーマンスを実現するスパイク表現法(DSR)の差分法を提案する。
論文 参考訳(メタデータ) (2022-05-01T12:44:49Z) - Renovating Parsing R-CNN for Accurate Multiple Human Parsing [22.191561830523774]
複数の人間のパーシングは、様々な人間の部分を分割し、各部分と対応するインスタンスを同時に関連付けることを目的としている。
本稿では,グローバルな意味的拡張機能ピラミッドネットワークと構文再構成ネットワークを導入したRenovating Parsing R-CNN(RP R-CNN)を提案する。
RP R-CNNはCIHPおよびMHP-v2データセットの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2020-09-20T14:55:35Z) - Enhancing Graph Neural Network-based Fraud Detectors against Camouflaged
Fraudsters [78.53851936180348]
近年の実証研究,すなわち特徴カモフラージュと関係カモフラージュの2種類のカモフラージュを紹介した。
既存のGNNはこれらの2つのカモフラージュに対処していない。
カモフラージュ抵抗型GNN(CARE-GNN)と呼ばれる新しいモデルを提案し、カモフラージュに対する3つのユニークなモジュールを用いたGNN集約プロセスを強化する。
論文 参考訳(メタデータ) (2020-08-19T22:33:12Z) - FATNN: Fast and Accurate Ternary Neural Networks [89.07796377047619]
Ternary Neural Networks (TNN) は、完全な精度のニューラルネットワークよりもはるかに高速で、電力効率が高いため、多くの注目を集めている。
そこで本研究では、3次内積の計算複雑性を2。
性能ギャップを軽減するために,実装に依存した3次量子化アルゴリズムを精巧に設計する。
論文 参考訳(メタデータ) (2020-08-12T04:26:18Z) - Noise-Response Analysis of Deep Neural Networks Quantifies Robustness
and Fingerprints Structural Malware [48.7072217216104]
ディープ・ニューラル・ネットワーク(DNN)は構造的マルウェア(すなわち、重みと活性化経路)を持つ
バックドアの検出は一般的に困難であり、既存の検出手法は計算に高価であり、膨大なリソースを必要とする(トレーニングデータへのアクセスなど)。
そこで本研究では,DNNの堅牢性,指紋の非線形性を定量化し,バックドアの検出を可能にする,高速な特徴生成手法を提案する。
実験の結果,既存の手法(秒対秒)よりも高い信頼度でバックドアを正確に検出できることが判明した。
論文 参考訳(メタデータ) (2020-07-31T23:52:58Z) - Depthwise Separable Convolutions Versus Recurrent Neural Networks for
Monaural Singing Voice Separation [17.358040670413505]
我々は歌声分離に重点を置き、RNNアーキテクチャを採用し、RNNをDWS畳み込み(DWS-CNN)に置き換える。
本稿では,DWS-CNNのチャネル数と層数による音源分離性能への影響について検討する。
その結果、RNNをDWS-CNNに置き換えることで、RNNアーキテクチャのパラメータの20.57%しか使用せず、それぞれ1.20、0.06、0.37dBの改善が得られることがわかった。
論文 参考訳(メタデータ) (2020-07-06T12:32:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。