論文の概要: Inception-Based Crowd Counting -- Being Fast while Remaining Accurate
- arxiv url: http://arxiv.org/abs/2210.09796v1
- Date: Tue, 18 Oct 2022 12:12:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 15:06:49.803151
- Title: Inception-Based Crowd Counting -- Being Fast while Remaining Accurate
- Title(参考訳): インセプションベースのクラウドカウンタ - 正確性を維持しながら高速に
- Authors: Yiming Ma
- Abstract要約: Inception-V3に基づく新しい手法を提案し,計算量を削減する。
実験の結果、ICCは最大で85.3%の計算を減らし、24.4%のパフォーマンス損失を減らした。
- 参考スコア(独自算出の注目度): 3.274290296343038
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent sophisticated CNN-based algorithms have demonstrated their
extraordinary ability to automate counting crowds from images, thanks to their
structures which are designed to address the issue of various head scales.
However, these complicated architectures also increase computational complexity
enormously, making real-time estimation implausible. Thus, in this paper, a new
method, based on Inception-V3, is proposed to reduce the amount of computation.
This proposed approach (ICC), exploits the first five inception blocks and the
contextual module designed in CAN to extract features at different receptive
fields, thereby being context-aware. The employment of these two different
strategies can also increase the model's robustness. Experiments show that ICC
can at best reduce 85.3 percent calculations with 24.4 percent performance
loss. This high efficiency contributes significantly to the deployment of crowd
counting models in surveillance systems to guard the public safety. The code
will be available at https://github.com/YIMINGMA/CrowdCounting-ICC,and its
pre-trained weights on the Crowd Counting dataset, which comprises a large
variety of scenes from surveillance perspectives, will also open-sourced.
- Abstract(参考訳): 最近のCNNベースのアルゴリズムは、様々なヘッドスケールの問題に対処するために設計された構造のおかげで、画像から群衆をカウントする異常な能力を示している。
しかし、これらの複雑なアーキテクチャは計算の複雑さを大きく増加させ、リアルタイムな推定は意味をなさない。
そこで本研究では,Inception-V3に基づく新しい手法を提案し,計算量を削減する。
提案手法は,最初の5つの開始ブロックとCANで設計したコンテキストモジュールを利用して,異なる受容領域の特徴を抽出し,コンテキスト認識を実現する。
これら2つの戦略が採用されれば、モデルの堅牢性も向上する。
実験の結果、ICCは最大で85.3%の計算を減らし、24.4%のパフォーマンス損失を減らした。
この高効率は、公共の安全を守るために監視システムにおける群衆カウントモデルの導入に大きく寄与する。
コードはhttps://github.com/yimingma/crowdcounting-iccで利用可能になる予定で、事前トレーニング済みのデータセットは監視の観点からさまざまなシーンで構成されており、オープンソース化される予定である。
関連論文リスト
- COTR: Compact Occupancy TRansformer for Vision-based 3D Occupancy Prediction [60.87168562615171]
自動運転コミュニティは、3Dの占有率予測に大きな関心を示している。
我々は、幾何学的占有率エンコーダと意味論的グループデコーダを備えたコンパクト占有率TRansformer (COTR)を提案する。
COTRは、8%から15%の相対的な改善でベースラインを上回っている。
論文 参考訳(メタデータ) (2023-12-04T14:23:18Z) - Window-Based Early-Exit Cascades for Uncertainty Estimation: When Deep
Ensembles are More Efficient than Single Models [5.0401589279256065]
アンサンブルは、アーキテクチャファミリ内の単一モデルをスケーリングするよりも、より計算的に(推論において)効率的であることを示す。
本研究では,不確実性推定に関連する課題に対して,これらの効率性の向上について検討する。
多数のネットワークアーキテクチャおよび不確実性タスクにわたるImageNetスケールデータの実験により、提案したウィンドウベースの早期実行アプローチは、より優れた不確実性計算トレードオフを実現することができることを示す。
論文 参考訳(メタデータ) (2023-03-14T15:57:54Z) - ClusTR: Exploring Efficient Self-attention via Clustering for Vision
Transformers [70.76313507550684]
本稿では,密集自己注意の代替として,コンテンツに基づくスパースアテンション手法を提案する。
具体的には、合計トークン数を減少させるコンテンツベースの方法として、キーとバリュートークンをクラスタ化し、集約する。
結果として得られたクラスタ化されたTokenシーケンスは、元の信号のセマンティックな多様性を保持するが、より少ない計算コストで処理できる。
論文 参考訳(メタデータ) (2022-08-28T04:18:27Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - FusionCount: Efficient Crowd Counting via Multiscale Feature Fusion [36.15554768378944]
本稿では,新しい群集カウントアーキテクチャ(FusionCount)を提案する。
マルチスケールな特徴を得るために、追加の抽出コンポーネントに頼るのではなく、ほとんどのエンコードされた特徴の適応的な融合を利用する。
2つのベンチマークデータベースの実験により、我々のモデルは計算の複雑さを減らして最先端の結果が得られることを示した。
論文 参考訳(メタデータ) (2022-02-28T10:04:07Z) - Verifiable Coded Computing: Towards Fast, Secure and Private Distributed
Machine Learning [13.09925205966904]
分散クラウドコンピューティングの主なボトルネックは、ストラグラー、ビザンチン労働者、データプライバシである。
本稿では,Byzantineノード検出チャレンジをトラグラー耐性から分離する検証可能なコード計算フレームワークを提案する。
実験の結果,VCCは分散ロジスティック回帰の非符号化実装を3.2times-6.9times$で高速化することがわかった。
論文 参考訳(メタデータ) (2021-07-27T17:23:09Z) - Efficient Inference via Universal LSH Kernel [35.22983601434134]
本稿では,単純なハッシュ計算と集約で推論手順を近似できる数列の簡潔な集合である,数学的に証明可能なRepresenter Sketchを提案する。
Representer Sketchは、カーネル文学から人気のあるRepresenter Theoremの上に構築されている。
本研究では,Representer Sketchによるストレージ要件の最大114倍,複雑性の最大59倍を精度の低下なく達成できることを示す。
論文 参考訳(メタデータ) (2021-06-21T22:06:32Z) - PSCNet: Pyramidal Scale and Global Context Guided Network for Crowd
Counting [44.306790250158954]
本稿では,ピラミッドスケールモジュール (PSM) とグローバルコンテキストモジュール (GCM) に基づく新しい群集カウント手法を提案する。
PSMは、異なる画像スケールの群衆の境界を識別できる多スケール情報を適応的にキャプチャするために使用される。
GCMは、機能マップのチャネル全体のインタラクティブな情報をより効率的にするために、低複雑さと軽量な方法で考案されています。
論文 参考訳(メタデータ) (2020-12-07T11:35:56Z) - CARAFE++: Unified Content-Aware ReAssembly of FEatures [132.49582482421246]
この目標を達成するために、ユニバーサルで軽量で高効率なオペレータであるContent-Aware ReAssembly of FEatures(CARAFE++)を提案します。
CARAFE++は、インスタンス固有のコンテンツ認識処理を可能にするアダプティブカーネルをオンザフライで生成する。
計算のオーバーヘッドが無視できるすべてのタスクにおいて、一貫性と実質的な利益を示しています。
論文 参考訳(メタデータ) (2020-12-07T07:34:57Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z) - Faster Secure Data Mining via Distributed Homomorphic Encryption [108.77460689459247]
ホモモルフィック暗号化(HE)は、最近、暗号化されたフィールド上で計算を行う能力により、ますます注目を集めている。
本稿では,スケーリング問題の解決に向けて,新しい分散HEベースのデータマイニングフレームワークを提案する。
各種データマイニングアルゴリズムとベンチマークデータセットを用いて,新しいフレームワークの有効性と有効性を検証する。
論文 参考訳(メタデータ) (2020-06-17T18:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。