論文の概要: Exploring Scale Shift in Crowd Localization under the Context of Domain Generalization
- arxiv url: http://arxiv.org/abs/2510.19330v1
- Date: Wed, 22 Oct 2025 07:45:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.326108
- Title: Exploring Scale Shift in Crowd Localization under the Context of Domain Generalization
- Title(参考訳): ドメイン・ジェネリゼーションの文脈下におけるクラウド・ローカライゼーションにおけるスケール・シフトの探索
- Authors: Juncheng Wang, Lei Shang, Ziqi Liu, Wang Lu, Xixu Hu, Zhe Hu, Jindong Wang, Shujun Wang,
- Abstract要約: 群集の局所化は、群集内の各歩行者の位置を予測するための視覚的シーン理解において重要な役割を担っている。
既存のアプローチでは、トレーニングデータとテストデータ間のヘッドスケール分布(スケールシフト)の相違により、パフォーマンスが著しく低下する。
本稿では,クラウドローカライゼーションモデルにおける領域一般化の文脈におけるスケールシフトの性質を理解することを目的とする。
- 参考スコア(独自算出の注目度): 36.247310117173136
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Crowd localization plays a crucial role in visual scene understanding towards predicting each pedestrian location in a crowd, thus being applicable to various downstream tasks. However, existing approaches suffer from significant performance degradation due to discrepancies in head scale distributions (scale shift) between training and testing data, a challenge known as domain generalization (DG). This paper aims to comprehend the nature of scale shift within the context of domain generalization for crowd localization models. To this end, we address four critical questions: (i) How does scale shift influence crowd localization in a DG scenario? (ii) How can we quantify this influence? (iii) What causes this influence? (iv) How to mitigate the influence? Initially, we conduct a systematic examination of how crowd localization performance varies with different levels of scale shift. Then, we establish a benchmark, ScaleBench, and reproduce 20 advanced DG algorithms to quantify the influence. Through extensive experiments, we demonstrate the limitations of existing algorithms and underscore the importance and complexity of scale shift, a topic that remains insufficiently explored. To deepen our understanding, we provide a rigorous theoretical analysis on scale shift. Building on these insights, we further propose an effective algorithm called Causal Feature Decomposition and Anisotropic Processing (Catto) to mitigate the influence of scale shift in DG settings. Later, we also provide extensive analytical experiments, revealing four significant insights for future research. Our results emphasize the importance of this novel and applicable research direction, which we term Scale Shift Domain Generalization.
- Abstract(参考訳): 群集の局所化は、群集内の各歩行者の位置を予測するための視覚的シーン理解において重要な役割を担い、様々な下流のタスクに適用できる。
しかし、既存のアプローチでは、トレーニングデータとテストデータ間のヘッドスケール分布(スケールシフト)の相違により、パフォーマンスが著しく低下する。
本稿では,クラウドローカライゼーションモデルにおける領域一般化の文脈におけるスケールシフトの性質を理解することを目的とする。
この目的のために、我々は4つの重要な疑問に対処する。
i)DGシナリオにおけるスケールシフトは群集のローカライゼーションにどのように影響するか?
(ii) この影響を定量化するにはどうすればいいのか?
(三)この影響の原因は何か。
(四)その影響を緩和する方法。
当初我々は,群集の局所化性能がスケールシフトのレベルによってどう変化するか,体系的に検討した。
次に、ベンチマークであるScaleBenchを確立し、その影響を定量化するために、20の高度なDGアルゴリズムを再現する。
大規模な実験を通じて、既存のアルゴリズムの限界を実証し、スケールシフトの重要性と複雑さを浮き彫りにする。
理解を深めるために、スケールシフトに関する厳密な理論的分析を提供する。
これらの知見に基づいて、DG設定におけるスケールシフトの影響を軽減するために、因果分解(Causal Feature Decomposition)と異方性処理(Anisotropic Processing:Catto)と呼ばれる効果的なアルゴリズムを提案する。
その後、分析実験を行い、今後の研究の4つの重要な知見を明らかにした。
本研究は,スケールシフト・ドメイン・ジェネリゼーション(Scale Shift Domain Generalization)と呼ばれる,この新奇かつ適用可能な研究方向性の重要性を強調した。
関連論文リスト
- Spectral Insights into Data-Oblivious Critical Layers in Large Language Models [7.486925126518052]
我々は,事前調整言語モデルにおいて,本質的な臨界層を特定するためのデータ公開アプローチを提案する。
表現空間が著しく変化する層も微調整時に最も影響を受ける層であることを示す。
論文 参考訳(メタデータ) (2025-05-31T04:21:39Z) - Geospatial Disparities: A Case Study on Real Estate Prices in Paris [0.3495246564946556]
地理空間データから生じるバイアスを識別・緩和するためのツールキットを提案する。
空間的属性を持つ順序回帰ケースを2次分類の焦点から逸脱する。
本手法を概説し,本手法の実践的応用を実証し,公正度と校正対策のための地理的集約レベルを選択することの意味を精査する。
論文 参考訳(メタデータ) (2024-01-29T14:53:14Z) - How Well Does GPT-4V(ision) Adapt to Distribution Shifts? A Preliminary
Investigation [90.93999543169296]
GPT-4Vは最も先進的な多モード基盤モデルとして機能する。
本研究は, GPT-4Vの動的環境における適応性と一般化能力について, 厳密に評価する。
論文 参考訳(メタデータ) (2023-12-12T16:48:07Z) - Boosted Control Functions: Distribution generalization and invariance in confounded models [10.503777692702952]
非線形で非同定可能な構造関数が存在する場合でも分布の一般化を可能にする不変性という強い概念を導入する。
フレキシブルな機械学習手法を用いて,ブースト制御関数(BCF)を推定する制御Twicingアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-09T15:43:46Z) - Position-aware Structure Learning for Graph Topology-imbalance by
Relieving Under-reaching and Over-squashing [67.83086131278904]
トポロジー不均衡は、ラベル付きノードの不均一なトポロジー位置によって引き起こされるグラフ固有の不均衡問題である。
PASTEL という新しい位置認識型グラフ構造学習フレームワークを提案する。
私たちの重要な洞察は、より監督的な情報を得るために、同じクラス内のノードの接続性を高めることです。
論文 参考訳(メタデータ) (2022-08-17T14:04:21Z) - Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring
Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。
3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文 参考訳(メタデータ) (2021-07-27T14:47:24Z) - Where Should We Begin? A Low-Level Exploration of Weight Initialization
Impact on Quantized Behaviour of Deep Neural Networks [93.4221402881609]
異なる重みの初期化が重みの最終的な分布と異なるCNNアーキテクチャの活性化に与える影響について、詳細なアブレーション研究を行う。
我々の知る限りでは、ウェイトの初期化とその量子化行動に対する影響について、そのような低レベルで詳細な定量分析を行うのは、私たちは初めてである。
論文 参考訳(メタデータ) (2020-11-30T06:54:28Z) - Effective Sample Size, Dimensionality, and Generalization in Covariate
Shift Adaptation [0.0]
教師あり学習において,サンプルサイズ,次元性,モデル性能/一般化がどの程度有効かを示す。
本稿では,ESS,データ次元,一般化を結合する統一ビューの構築に焦点をあてる。
論文 参考訳(メタデータ) (2020-10-02T20:22:59Z) - Extreme Memorization via Scale of Initialization [72.78162454173803]
我々は,初期化の規模を変えることが,SGDによって誘導される暗黙の正規化に強く影響を与える実験装置を構築する。
一般化能力に影響を及ぼす範囲と方法が、使用したアクティベーションと損失関数に依存することがわかった。
均質なReLU活性化の場合、この挙動は損失関数に起因することが示される。
論文 参考訳(メタデータ) (2020-08-31T04:53:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。