論文の概要: FSCA-Net: Feature-Separated Cross-Attention Network for Robust Multi-Dataset Training
- arxiv url: http://arxiv.org/abs/2602.01540v1
- Date: Mon, 02 Feb 2026 02:18:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.845017
- Title: FSCA-Net: Feature-Separated Cross-Attention Network for Robust Multi-Dataset Training
- Title(参考訳): FSCA-Net:ロバストなマルチデータセットトレーニングのための特徴分離型クロスアテンションネットワーク
- Authors: Yuehai Chen,
- Abstract要約: 本稿では,特徴表現をドメイン不変およびドメイン固有コンポーネントに分離する統合フレームワークを提案する。
新しいクロスアテンション融合モジュールは、これらのコンポーネント間の相互作用を適応的にモデル化し、効果的な知識伝達を保証する。
複数のクラウドカウントベンチマークの実験では、FSCA-Netは負の転送を効果的に軽減し、最先端のクロスデータセットの一般化を実現する。
- 参考スコア(独自算出の注目度): 3.2658295979028753
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Crowd counting plays a vital role in public safety, traffic regulation, and smart city management. However, despite the impressive progress achieved by CNN- and Transformer-based models, their performance often deteriorates when applied across diverse environments due to severe domain discrepancies. Direct joint training on multiple datasets, which intuitively should enhance generalization, instead results in negative transfer, as shared and domain-specific representations become entangled. To address this challenge, we propose the Feature Separation and Cross-Attention Network FSCA-Net, a unified framework that explicitly disentangles feature representations into domain-invariant and domain-specific components. A novel cross-attention fusion module adaptively models interactions between these components, ensuring effective knowledge transfer while preserving dataset-specific discriminability. Furthermore, a mutual information optimization objective is introduced to maximize consistency among domain-invariant features and minimize redundancy among domain-specific ones, promoting complementary shared-private representations. Extensive experiments on multiple crowd counting benchmarks demonstrate that FSCA-Net effectively mitigates negative transfer and achieves state-of-the-art cross-dataset generalization, providing a robust and scalable solution for real-world crowd analysis.
- Abstract(参考訳): 群衆のカウントは公共の安全、交通規制、スマートシティ管理において重要な役割を担っている。
しかし、CNNとTransformerベースのモデルによって達成された顕著な進歩にもかかわらず、その性能はドメインの相違が激しいため、様々な環境にまたがって適用されると劣化することが多い。
直感的に一般化を促進すべきである複数のデータセットの直接共同トレーニングは、共有およびドメイン固有の表現が絡み合うにつれて、負の移動をもたらす。
この課題に対処するために,機能分離・クロスアテンションネットワークFSCA-Netを提案する。
新しいクロスアテンション融合モジュールは、これらのコンポーネント間の相互作用を適応的にモデル化し、データセット固有の識別性を維持しながら効果的な知識伝達を保証する。
さらに、ドメイン不変の特徴間の一貫性を最大化し、ドメイン固有の特徴間の冗長性を最小化し、補完的な共有プライベート表現を促進するために、相互情報最適化の目的を導入する。
複数のクラウドカウントベンチマークに対する大規模な実験により、FSCA-Netは負の転送を効果的に軽減し、最先端のクロスデータセットの一般化を実現し、現実世界のクラウド分析のための堅牢でスケーラブルなソリューションを提供することが示された。
関連論文リスト
- HFedATM: Hierarchical Federated Domain Generalization via Optimal Transport and Regularized Mean Aggregation [12.655334562608314]
Federated Learning(FL)は、複数のクライアントが生データを共有せずに、共同で共有グローバルモデルをトレーニングする分散アプローチである。
本稿では階層型フェデレーションドメイン一般化(HFedDG)を紹介する。
論文 参考訳(メタデータ) (2025-08-07T08:14:52Z) - Federated Cross-Domain Click-Through Rate Prediction With Large Language Model Augmentation [4.978132660177235]
大規模言語モデル拡張(FedCCTR-LM)を用いたFedCCTR予測について述べる。
まずプライバシ保護強化ネットワーク(PrivNet)では,ユーザとアイテムの表現を充実させるために,大規模な言語モデルを採用している。
第2に、IDST-CL(Independent Domain-Specific Transformer with Contrastive Learning)モジュールは、ドメイン固有の、共有されたユーザの好みを乱す。
第3に、Adaptive Local Differential Privacy(AdaLDP)メカニズムは、ノイズ注入を動的に校正し、厳密なプライバシー保証と予測精度の最適なバランスを実現する。
論文 参考訳(メタデータ) (2025-03-21T06:22:42Z) - Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.31351006532924]
人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-29T17:59:45Z) - Multisource Collaborative Domain Generalization for Cross-Scene Remote Sensing Image Classification [57.945437355714155]
クロスシーン画像分類は, 異なる分布領域のアノテート領域に, 地中物質の事前の知識を伝達することを目的としている。
既存のアプローチでは、未確認のターゲットドメインへの単一ソースドメインの一般化に重点を置いている。
マルチソースリモートセンシングデータの均一性と不均一性特性に基づく,新しいマルチソース協調型ドメイン一般化フレームワーク(MS-CDG)を提案する。
論文 参考訳(メタデータ) (2024-12-05T06:15:08Z) - Improving Anomaly Segmentation with Multi-Granularity Cross-Domain
Alignment [17.086123737443714]
異常セグメンテーションは、画像中の非定型物体を識別する上で重要な役割を担っている。
既存の手法は合成データに顕著な結果を示すが、合成データドメインと実世界のデータドメインの相違を考慮できないことが多い。
シーンと個々のサンプルレベルの両方で、ドメイン間の機能を調和させるのに適した、マルチグラニュラリティ・クロスドメインアライメントフレームワークを導入します。
論文 参考訳(メタデータ) (2023-08-16T22:54:49Z) - A Novel Cross-Perturbation for Single Domain Generalization [54.612933105967606]
単一ドメインの一般化は、モデルが単一のソースドメインでトレーニングされたときに未知のドメインに一般化する能力を高めることを目的としている。
トレーニングデータの限られた多様性は、ドメイン不変の特徴の学習を妨げ、結果として一般化性能を損なう。
トレーニングデータの多様性を高めるために,CPerbを提案する。
論文 参考訳(メタデータ) (2023-08-02T03:16:12Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Towards Adaptive Semantic Segmentation by Progressive Feature Refinement [16.40758125170239]
セグメンテーションネットワークの転送可能性を高めるために,ドメイン逆学習とともに,革新的なプログレッシブな特徴改善フレームワークを提案する。
その結果、ソース・ドメイン・イメージで訓練されたセグメンテーション・モデルは、大幅な性能劣化を伴わずにターゲット・ドメインに転送できる。
論文 参考訳(メタデータ) (2020-09-30T04:17:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。