論文の概要: Bi-level Alignment for Cross-Domain Crowd Counting
- arxiv url: http://arxiv.org/abs/2205.05844v1
- Date: Thu, 12 May 2022 02:23:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-14 00:50:05.056931
- Title: Bi-level Alignment for Cross-Domain Crowd Counting
- Title(参考訳): クロスドメインクラウドカウントのための双方向アライメント
- Authors: Shenjian Gong, Shanshan Zhang, Jian Yang, Dengxin Dai and Bernt
Schiele
- Abstract要約: 現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
- 参考スコア(独自算出の注目度): 113.78303285148041
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, crowd density estimation has received increasing attention. The
main challenge for this task is to achieve high-quality manual annotations on a
large amount of training data. To avoid reliance on such annotations, previous
works apply unsupervised domain adaptation (UDA) techniques by transferring
knowledge learned from easily accessible synthetic data to real-world datasets.
However, current state-of-the-art methods either rely on external data for
training an auxiliary task or apply an expensive coarse-to-fine estimation. In
this work, we aim to develop a new adversarial learning based method, which is
simple and efficient to apply. To reduce the domain gap between the synthetic
and real data, we design a bi-level alignment framework (BLA) consisting of (1)
task-driven data alignment and (2) fine-grained feature alignment. In contrast
to previous domain augmentation methods, we introduce AutoML to search for an
optimal transform on source, which well serves for the downstream task. On the
other hand, we do fine-grained alignment for foreground and background
separately to alleviate the alignment difficulty. We evaluate our approach on
five real-world crowd counting benchmarks, where we outperform existing
approaches by a large margin. Also, our approach is simple, easy to implement
and efficient to apply. The code is publicly available at
https://github.com/Yankeegsj/BLA.
- Abstract(参考訳): 近年,群集密度推定が注目されている。
このタスクの主な課題は、大量のトレーニングデータで高品質な手動アノテーションを実現することである。
このようなアノテーションへの依存を避けるため、従来の研究は教師なしドメイン適応(UDA)技術を適用し、容易にアクセス可能な合成データから学習した知識を実世界のデータセットに転送する。
しかし、現在の最先端の手法は、補助的なタスクを訓練するための外部データに依存するか、高価な粗大な推定を適用している。
本研究は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発することを目的とする。
合成データと実データとのドメイン間ギャップを低減するために,(1)タスク駆動型データアライメントと(2)細粒度機能アライメントからなるbi-level alignment framework(bla)を設計した。
従来のドメイン拡張手法とは対照的に、ソース上の最適な変換を探すためにAutoMLを導入します。
一方,アライメントの困難さを軽減するために,前景と背景の微粒なアライメントを別々に行う。
我々は,既存の手法を大差で上回る5つの実世界の群衆数ベンチマークについて評価した。
また、私たちのアプローチはシンプルで、実装が簡単で、適用も効率的です。
コードはhttps://github.com/Yankeegsj/BLAで公開されている。
関連論文リスト
- Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Okapi: Generalising Better by Making Statistical Matches Match [7.392460712829188]
オカピは、オンライン統計マッチングに基づく頑健な半教師あり学習のためのシンプルで効率的で汎用的な方法である。
提案手法では, 最寄りのマッチング手法を用いて, 整合性損失に対するクロスドメインビューを生成する。
経験的リスクの最小化を改善するために、余分な遅延のないデータを活用することは実際に可能であることを示す。
論文 参考訳(メタデータ) (2022-11-07T12:41:17Z) - Deep Active Ensemble Sampling For Image Classification [8.31483061185317]
アクティブラーニングフレームワークは、最も有益なデータポイントのラベル付けを積極的に要求することで、データアノテーションのコストを削減することを目的としている。
提案手法には、不確実性に基づく手法、幾何学的手法、不確実性に基づく手法と幾何学的手法の暗黙の組み合わせなどがある。
本稿では, サンプル選択戦略における効率的な探索・探索トレードオフを実現するために, 不確実性に基づくフレームワークと幾何学的フレームワークの両方の最近の進歩を革新的に統合する。
本フレームワークは,(1)正確な後続推定,(2)計算オーバーヘッドと高い精度のトレードオフの2つの利点を提供する。
論文 参考訳(メタデータ) (2022-10-11T20:20:20Z) - ProCST: Boosting Semantic Segmentation using Progressive Cyclic
Style-Transfer [38.03127458140549]
ドメイン適応技術を改善するための新しい2段階フレームワークを提案する。
最初のステップでは、複数のスケールのニューラルネットワークを段階的にトレーニングし、ソースデータからターゲットデータへの初期転送を行う。
この新たなデータは、所望のターゲットドメインとのドメインギャップを減らし、適用されたUDAアプローチにより、さらにギャップを埋める。
論文 参考訳(メタデータ) (2022-04-25T18:01:05Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - Contrastive Learning and Self-Training for Unsupervised Domain
Adaptation in Semantic Segmentation [71.77083272602525]
UDAはラベル付きソースドメインからラベルなしターゲットドメインへの効率的な知識伝達を試みている。
本稿では,領域にまたがるカテゴリ別センタロイドを適応させるコントラスト学習手法を提案する。
提案手法を自己学習で拡張し,メモリ効率の良い時間アンサンブルを用いて一貫性と信頼性の高い擬似ラベルを生成する。
論文 参考訳(メタデータ) (2021-05-05T11:55:53Z) - TSDAE: Using Transformer-based Sequential Denoising Auto-Encoder for
Unsupervised Sentence Embedding Learning [53.32740707197856]
TSDAE(Sequential Denoising Auto-Encoder)を用いた最新の非監視方式を提案する。
ドメイン内の監視されたアプローチのパフォーマンスの93.1%を達成することができる。
論文 参考訳(メタデータ) (2021-04-14T17:02:18Z) - OVANet: One-vs-All Network for Universal Domain Adaptation [78.86047802107025]
既存のメソッドは、検証または未知のサンプルの事前定義された比率に基づいて未知のサンプルを拒否するしきい値を手動で設定します。
本稿では,ソースサンプルを用いて閾値を学習し,対象領域に適応する手法を提案する。
私たちの考えは、ソースドメインの最小クラス間距離は、ターゲットの既知のか未知かを決定するための良いしきい値であるべきです。
論文 参考訳(メタデータ) (2021-04-07T18:36:31Z) - Flexible deep transfer learning by separate feature embeddings and
manifold alignment [0.0]
オブジェクト認識は、業界と防衛において重要な存在である。
残念ながら、既存のラベル付きデータセットでトレーニングされたアルゴリズムは、データ分布が一致しないため、直接新しいデータに一般化しない。
本稿では,各領域の特徴抽出を個別に学習することで,この制限を克服する新しいディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-22T19:24:44Z) - Unsupervised Intra-domain Adaptation for Semantic Segmentation through
Self-Supervision [73.76277367528657]
畳み込みニューラルネットワークに基づくアプローチは、セマンティックセグメンテーションにおいて顕著な進歩を遂げた。
この制限に対処するために、グラフィックエンジンから生成された注釈付きデータを使用してセグメンテーションモデルをトレーニングする。
ドメイン間およびドメイン間ギャップを最小化する2段階の自己教師付きドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T15:24:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。