論文の概要: Optimising CSRNet with parameter-free attention mechanisms for crowd counting in public transport
- arxiv url: http://arxiv.org/abs/2605.18349v1
- Date: Mon, 18 May 2026 13:07:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.617477
- Title: Optimising CSRNet with parameter-free attention mechanisms for crowd counting in public transport
- Title(参考訳): 公共交通機関における群集カウントのためのパラメータフリーアテンション機構を用いたCSRNetの最適化
- Authors: Aida Rostamza, Enrico Del Re, Joshua Cherian Varughese, Cristina Olaverri-Monreal,
- Abstract要約: スマートで効率的な公共交通機関を設計する上で、職業推定と群集カウントは重要な課題である。
本稿では, 混雑したシーンにおける群集カウントと密度マップ推定におけるパラメータフリーアテンション機構の有効性について検討する。
ShanghaiTechデータセットの実験では、パラメータフリーのアテンションメカニズムが、追加のモデルパラメータを導入することなく、同等または優れた精度を達成することを示した。
- 参考スコア(独自算出の注目度): 0.22883767957129061
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occupancy estimation and crowd counting are critical tasks in designing smart and efficient public transport vehicles. Given that public transport loading can vary from sparse to crowded, classical models for occupancy estimation must be adapted to suit this purpose. Attention mechanisms have shown remarkable capability in enhancing the representational power of deep neural networks for crowd counting in congested scenes with occlusion, complex backgrounds, and perspective distortion. However, conventional approaches, often implemented as parameterized sub-networks within convolutional layers, inevitably increase model size and computational cost, limiting deployment on resource-constrained edge devices. This paper investigates the effectiveness of state-of-the-art parameter-free attention mechanisms for crowd counting and density map estimation in highly congested scenes. We evaluate channel-wise (PFCA), spatial-wise (SA), and 3-D (SimAM) modules and compare their performance with parameterized attention modules constrained to introduce no more than 1% additional parameters. Furthermore, we present a novel combination of attention mechanisms that combines the strengths of PFCA and SA (PFCASA) customized for analyzing video streams onboard public transport systems. Using CSRNet as the backbone, experiments on the ShanghaiTech dataset demonstrate that parameter-free attention mechanisms achieve comparable or superior accuracy without introducing additional model parameters. A detailed performance analysis further reveals that PFCASA outperforms other attention modules in scenes with fewer than 40 individuals, while PFCA shows greater effectiveness as crowd density increases, underscoring their potential applicability for integration into smart public transport modalities.
- Abstract(参考訳): スマートで効率的な公共交通機関を設計する上で、職業推定と群集カウントは重要な課題である。
公共交通機関の積み込みは、スパースから混み合ったものまで様々であるので、占有率推定のための古典的なモデルは、この目的に適応する必要がある。
注意機構は、密集したシーン、複雑な背景、視点歪みを持つ群衆を数えるためのディープニューラルネットワークの表現力を高める際、顕著な能力を示している。
しかしながら、従来のアプローチは畳み込み層内でパラメータ化サブネットワークとして実装され、必然的にモデルサイズと計算コストが増加し、リソース制約されたエッジデバイスへのデプロイメントが制限される。
本稿では,混雑したシーンにおける群集カウントと密度マップ推定における最先端パラメータフリーアテンションメカニズムの有効性について検討する。
チャネルワイズ (PFCA) , 空間ワイズ (SA) , 3D (SimAM) モジュールの評価を行い, パラメータ化アテンションモジュールとの比較を行った。
さらに,公共交通機関上での映像ストリームの分析用にカスタマイズされたPFCAとSA(PFCASA)の強みを組み合わせた新しいアテンション機構を提案する。
バックボーンとしてCSRNetを使用することで、ShanghaiTechデータセットの実験は、追加のモデルパラメータを導入することなく、パラメータフリーアテンションメカニズムが同等または優れた精度を達成することを示した。
詳細なパフォーマンス分析により、PFCASAは40人未満のシーンで他の注目モジュールよりも優れており、PFCAは群衆密度が増大するにつれて高い効果を示し、スマートな公共交通手段への統合の可能性を強調している。
関連論文リスト
- Joint Channel Estimation and Computation Offloading in Fluid Antenna-assisted MEC Networks [81.36647816787713]
チャネル推定の遅延を最小限に抑えるためのFA支援オフロードフレームワークを提案する。
提案方式は,効率的な通信を行う場合の精度を大幅に低下させることを示す。
論文 参考訳(メタデータ) (2025-09-16T08:48:44Z) - USAD: End-to-End Human Activity Recognition via Diffusion Model with Spatiotemporal Attention [8.061018589897277]
人間の活動認識は、健康モニタリング、安全保護、スポーツ分析に幅広い応用を見出すタスクである。
研究の進展にもかかわらず、ヒトの活動認識は、稀な活動のためのラベル付きサンプルの不足など、依然として重要な課題に直面している。
本稿では,マルチアテンション相互作用機構に着目した包括的な最適化手法を提案する。
論文 参考訳(メタデータ) (2025-07-03T17:38:44Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Interpreting and Improving Attention From the Perspective of Large Kernel Convolution [51.06461246235176]
本稿では,LKCA(Large Kernel Convolutional Attention)について紹介する。
LKCAは、特にデータ制約のある設定において、様々な視覚的タスク間での競合性能を達成する。
論文 参考訳(メタデータ) (2024-01-11T08:40:35Z) - Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model [81.55141188169621]
PEFTにクロスブロックオーケストレーション機構を組み、SAM(Segment Anything Model)の様々な下流シナリオへの適応を可能にする。
本稿では,超複素層から重みが生じる線形射影ヘッドを導入するブロック内拡張モジュールを提案する。
提案手法は,約1Kのパラメータのみを付加した新規シナリオにおいて,セグメンテーション性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-28T11:23:34Z) - Systematic Architectural Design of Scale Transformed Attention Condenser
DNNs via Multi-Scale Class Representational Response Similarity Analysis [93.0013343535411]
マルチスケールクラス表現応答類似性分析(ClassRepSim)と呼ばれる新しいタイプの分析法を提案する。
ResNetスタイルのアーキテクチャにSTACモジュールを追加すると、最大1.6%の精度が向上することを示す。
ClassRepSim分析の結果は、STACモジュールの効果的なパラメータ化を選択するために利用することができ、競争性能が向上する。
論文 参考訳(メタデータ) (2023-06-16T18:29:26Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Self-Supervised Implicit Attention: Guided Attention by The Model Itself [1.3406858660972554]
我々は、深層ニューラルネットワークモデルに適応的に誘導し、モデル自体の特性を活用する新しいアプローチである、自己監視インシシット注意(SSIA:Self-Supervised Implicit Attention)を提案する。
SSIAAは、推論中に余分なパラメータ、計算、メモリアクセスコストを必要としない新しいアテンションメカニズムである。
私たちの実装はGitHubで公開されます。
論文 参考訳(メタデータ) (2022-06-15T10:13:34Z) - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial
Images [24.35779077001839]
グローバルな相関関係を適応的に捉えるために,Hybrid Multiple Attention Network (HMANet) という新しいアテンションベースのフレームワークを提案する。
本稿では,機能的冗長性を低減し,自己注意機構の効率を向上させるため,単純で効果的な領域シャッフルアテンション(RSA)モジュールを提案する。
論文 参考訳(メタデータ) (2020-01-09T07:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。