論文の概要: Indirect-Instant Attention Optimization for Crowd Counting in Dense
Scenes
- arxiv url: http://arxiv.org/abs/2206.05648v1
- Date: Sun, 12 Jun 2022 03:29:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-15 11:40:27.825418
- Title: Indirect-Instant Attention Optimization for Crowd Counting in Dense
Scenes
- Title(参考訳): ディエンスシーンにおける群集カウントの間接的インスタントアテンション最適化
- Authors: Suyu Han, Guodong Wang, Donghua Liu
- Abstract要約: SoftMax-Attentionに基づく間接インスタントアテンション最適化(IIAO)モジュール。
特殊変換は比較的粗い特徴をもたらすが、本来は人口密度分布によって予測的誤認可能性が異なる。
局所相関損失 (RCLoss) を調整し, 連続的なエラーが発生しやすい領域とスムーズな空間情報を検索する。
- 参考スコア(独自算出の注目度): 3.8950254639440094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of appealing approaches to guiding learnable parameter optimization, such
as feature maps, is global attention, which enlightens network intelligence at
a fraction of the cost. However, its loss calculation process still falls
short: 1)We can only produce one-dimensional 'pseudo labels' for attention,
since the artificial threshold involved in the procedure is not robust; 2) The
attention awaiting loss calculation is necessarily high-dimensional, and
decreasing it by convolution will inevitably introduce additional learnable
parameters, thus confusing the source of the loss. To this end, we devise a
simple but efficient Indirect-Instant Attention Optimization (IIAO) module
based on SoftMax-Attention , which transforms high-dimensional attention map
into a one-dimensional feature map in the mathematical sense for loss
calculation midway through the network, while automatically providing adaptive
multi-scale fusion to feature pyramid module. The special transformation yields
relatively coarse features and, originally, the predictive fallibility of
regions varies by crowd density distribution, so we tailor the Regional
Correlation Loss (RCLoss) to retrieve continuous error-prone regions and smooth
spatial information . Extensive experiments have proven that our approach
surpasses previous SOTA methods in many benchmark datasets.
- Abstract(参考訳): 特徴マップのような学習可能なパラメータ最適化を導くための魅力的なアプローチの1つは、ネットワークインテリジェンスをわずかなコストで啓蒙するグローバルアテンションである。
しかし、その損失計算プロセスは、1)手続きにかかわる人工的な閾値が堅牢ではないため、注意のために1次元の「pseudoラベル」しか作成できない、2) 損失計算を待つ注意は必ずしも高次元であり、畳み込みによってそれを減らすことは必然的に学習可能なパラメータをもたらし、損失の原因を混乱させる。
そこで我々は,高次元アテンションマップを1次元の特徴マップに変換してネットワーク中における損失計算を行い,特徴ピラミッドモジュールに適応的なマルチスケール融合を自動で提供する,シンプルで効率的な間接インスタントアテンション最適化(IIAO)モジュールを考案した。
この特殊変換は, 比較的粗い特徴を生じ, もともとは, 群集密度分布によって予測的誤認性が異なるため, 連続的なエラー発生領域とスムーズな空間情報を取得するために, 地域相関損失(RCLoss)を補正する。
大規模な実験により、多くのベンチマークデータセットにおいて、我々のアプローチが従来のSOTAメソッドを超えることが証明された。
関連論文リスト
- OCMG-Net: Neural Oriented Normal Refinement for Unstructured Point Clouds [18.234146052486054]
非構造点雲から指向性正規項を推定するための頑健な精錬法を提案する。
我々のフレームワークは、初期指向の正規性を洗練させるために、特徴空間に符号配向とデータ拡張を組み込んでいる。
従来手法に存在した騒音による方向の不整合の問題に対処するため, チャンファー正規距離と呼ばれる新しい指標を導入する。
論文 参考訳(メタデータ) (2024-09-02T09:30:02Z) - Short-Long Convolutions Help Hardware-Efficient Linear Attention to Focus on Long Sequences [60.489682735061415]
本稿では,状態空間モデルを短時間の畳み込みに置き換えたCHELAを提案する。
提案手法の有効性を示すために,Long Range Arenaベンチマークと言語モデリングタスクについて実験を行った。
論文 参考訳(メタデータ) (2024-06-12T12:12:38Z) - Quantization Avoids Saddle Points in Distributed Optimization [1.579622195923387]
分散非最適化は、多くの分散システムの重要な機能を支える。
本研究の目的は,サドル点収束を2次定常点収束に効果的に回避できることを示すことである。
簡単に調整可能な量子化により、ユーザの制御により、通信オーバーヘッドを積極的に削減できる。
論文 参考訳(メタデータ) (2024-03-15T15:58:20Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - An Accelerated Doubly Stochastic Gradient Method with Faster Explicit
Model Identification [97.28167655721766]
本稿では、分散正規化損失最小化問題に対する2倍加速勾配降下法(ADSGD)を提案する。
まず、ADSGDが線形収束率を達成でき、全体的な計算複雑性を低減できることを示す。
論文 参考訳(メタデータ) (2022-08-11T22:27:22Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - Regressive Domain Adaptation for Unsupervised Keypoint Detection [67.2950306888855]
ドメイン適応(DA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的とする。
本稿では,教師なしキーポイント検出のためのレグレッシブドメイン適応(RegDA)法を提案する。
提案手法は,異なるデータセット上のPCKにおいて,8%から11%の大幅な改善をもたらす。
論文 参考訳(メタデータ) (2021-03-10T16:45:22Z) - Overcoming Catastrophic Forgetting via Direction-Constrained
Optimization [43.53836230865248]
連続的な学習フレームワークにおいて,分類ネットワークの固定アーキテクチャを用いてディープラーニングモデルを学習するための最適化アルゴリズムの新たな設計について検討する。
本稿では,方向制約付き最適化(DCO)法について述べる。各タスクに対して,対応する最上向きの主方向を近似する線形オートエンコーダを導入する。
我々のアルゴリズムは、他の最先端の正規化に基づく連続学習法と比較して好適に機能することを示した。
論文 参考訳(メタデータ) (2020-11-25T08:45:21Z) - Towards Accurate Knowledge Transfer via Target-awareness Representation
Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。
TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。
各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文 参考訳(メタデータ) (2020-10-16T17:45:08Z) - Selective Convolutional Network: An Efficient Object Detector with
Ignoring Background [28.591619763438054]
Selective Convolutional Network (SCN) と呼ばれる効率的なオブジェクト検出器を導入し、意味のある情報を含む場所のみを選択的に計算する。
そこで本稿では,ネットワークの次を導くためのオーバーヘッドを無視できるような,精巧な構造を設計する。
論文 参考訳(メタデータ) (2020-02-04T10:07:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。