論文の概要: DSGC-Net: A Dual-Stream Graph Convolutional Network for Crowd Counting via Feature Correlation Mining
- arxiv url: http://arxiv.org/abs/2509.02261v1
- Date: Tue, 02 Sep 2025 12:35:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:04.022768
- Title: DSGC-Net: A Dual-Stream Graph Convolutional Network for Crowd Counting via Feature Correlation Mining
- Title(参考訳): DSGC-Net: 特徴相関マイニングによる集団カウントのためのデュアルストリームグラフ畳み込みネットワーク
- Authors: Yihong Wu, Jinqiao Wei, Xionghui Zhao, Yidi Li, Shaoyi Du, Bin Ren, Nicu Sebe,
- Abstract要約: 特徴相関マイニングに基づくDual-Stream Graph Convolutional NetworkであるDSGC-Netを提案する。
2つの意味グラフをモデル化することにより、密度の変動と表現分布の潜在的な特徴相関を捉える。
広く使われている3つのデータセットの実験では、DSGC-Netが現在の最先端の手法より優れていることが示されている。
- 参考スコア(独自算出の注目度): 70.17284306493814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based crowd counting methods have achieved remarkable progress in recent years. However, in complex crowd scenarios, existing models still face challenges when adapting to significant density distribution differences between regions. Additionally, the inconsistency of individual representations caused by viewpoint changes and body posture differences further limits the counting accuracy of the models. To address these challenges, we propose DSGC-Net, a Dual-Stream Graph Convolutional Network based on feature correlation mining. DSGC-Net introduces a Density Approximation (DA) branch and a Representation Approximation (RA) branch. By modeling two semantic graphs, it captures the potential feature correlations in density variations and representation distributions. The DA branch incorporates a density prediction module that generates the density distribution map, and constructs a density-driven semantic graph based on density similarity. The RA branch establishes a representation-driven semantic graph by computing global representation similarity. Then, graph convolutional networks are applied to the two semantic graphs separately to model the latent semantic relationships, which enhance the model's ability to adapt to density variations and improve counting accuracy in multi-view and multi-pose scenarios. Extensive experiments on three widely used datasets demonstrate that DSGC-Net outperforms current state-of-the-art methods. In particular, we achieve MAE of 48.9 and 5.9 in ShanghaiTech Part A and Part B datasets, respectively. The released code is available at: https://github.com/Wu-eon/CrowdCounting-DSGCNet.
- Abstract(参考訳): 近年,深層学習に基づく群集カウント法は顕著な進歩を遂げている。
しかし、複雑な群衆のシナリオでは、既存のモデルは領域間の大きな密度分布の違いに適応する際の課題に直面している。
さらに、視点の変化や身体姿勢の違いによる個人表現の不整合により、モデルのカウント精度はさらに制限される。
これらの課題に対処するために,特徴相関マイニングに基づくDual-Stream Graph Convolutional NetworkであるDSGC-Netを提案する。
DSGC-Netは密度近似(DA)ブランチと表現近似(RA)ブランチを導入している。
2つの意味グラフをモデル化することにより、密度の変動と表現分布の潜在的な特徴相関を捉える。
DAブランチは密度分布マップを生成する密度予測モジュールを組み込み、密度類似性に基づいた密度駆動意味グラフを構築する。
RAブランチは、グローバルな表現類似性を計算することによって、表現駆動セマンティックグラフを確立する。
次に、グラフ畳み込みネットワークを2つのセマンティックグラフに別々に適用し、潜在セマンティック関係をモデル化し、モデルが密度変動に適応し、マルチビューおよび多目的シナリオにおけるカウント精度を向上させる。
広く使われている3つのデータセットに対する大規模な実験は、DSGC-Netが現在の最先端の手法より優れていることを示している。
特に、上海工科大学のパートAとパートBのデータセットでそれぞれ48.9と5.9のMAEを達成する。
リリースされたコードは、https://github.com/Wu-eon/CrowdCounting-DSGCNet.comで入手できる。
関連論文リスト
- Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Network Intrusion Detection with Edge-Directed Graph Multi-Head Attention Networks [13.446986347747325]
本稿では,ネットワーク侵入検出のためのエッジ指向グラフマルチヘッドアテンションネットワーク(EDGMAT)を提案する。
EDGMATモデルでは,侵入検知モデルにマルチヘッドアテンション機構を導入し,マルチヘッドアテンション機構とエッジ特徴を組み合わせた付加的な重み学習を実現する。
論文 参考訳(メタデータ) (2023-10-26T12:30:11Z) - HDNet: A Hierarchically Decoupled Network for Crowd Counting [11.530565995318696]
本稿では,階層型分離ネットワーク(HDNet)を提案する。
HDNetは、いくつかの人気のあるカウントベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-12-12T06:01:26Z) - Mixed Graph Contrastive Network for Semi-Supervised Node Classification [63.924129159538076]
我々はMixed Graph Contrastive Network(MGCN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
本研究では,非摂動増強戦略と相関還元機構により,潜伏埋め込みの識別能力を向上する。
これら2つの設定を組み合わせることで、識別表現学習のために、豊富なノードと稀に価値あるラベル付きノードの両方から、豊富な監視情報を抽出する。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - Dense Dilated Convolutions Merging Network for Land Cover Classification [8.932848548221532]
リモートセンシング画像のランドカバー分類は、限られた量の注釈付きデータのために難しい課題である。
本稿では,高密度拡張畳み込みネットワーク(DDCM-Net)と呼ばれる新しいアーキテクチャを提案する。
提案するDDCM-Netの有効性,堅牢性,柔軟性を,ISPRS Potsdam および Vaihingen データセット上で実証する。
論文 参考訳(メタデータ) (2020-03-09T10:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。