論文の概要: Reinforced Pedestrian Attribute Recognition with Group Optimization
Reward
- arxiv url: http://arxiv.org/abs/2205.14042v1
- Date: Sat, 21 May 2022 03:38:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-12 09:33:56.210249
- Title: Reinforced Pedestrian Attribute Recognition with Group Optimization
Reward
- Title(参考訳): グループ最適化による強化歩行者属性認識
- Authors: Zhong Ji, Zhenfei Hu, Yaodong Wang, Shengjia Li
- Abstract要約: Pedestrian Attribute Recognition(PAR)における2つの重要な課題は、画像と属性のアライメント関係と、不均衡なデータ分布である。
本稿では,強化学習フレームワークによる意思決定課題として取り上げる。
エージェントを用いて各属性群を識別し,深層Q-ラーニングアルゴリズムを用いて学習する。
- 参考スコア(独自算出の注目度): 15.630702608104421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian Attribute Recognition (PAR) is a challenging task in intelligent
video surveillance. Two key challenges in PAR include complex alignment
relations between images and attributes, and imbalanced data distribution.
Existing approaches usually formulate PAR as a recognition task. Different from
them, this paper addresses it as a decision-making task via a reinforcement
learning framework. Specifically, PAR is formulated as a Markov decision
process (MDP) by designing ingenious states, action space, reward function and
state transition. To alleviate the inter-attribute imbalance problem, we apply
an Attribute Grouping Strategy (AGS) by dividing all attributes into subgroups
according to their region and category information. Then we employ an agent to
recognize each group of attributes, which is trained with Deep Q-learning
algorithm. We also propose a Group Optimization Reward (GOR) function to
alleviate the intra-attribute imbalance problem. Experimental results on the
three benchmark datasets of PETA, RAP and PA100K illustrate the effectiveness
and competitiveness of the proposed approach and demonstrate that the
application of reinforcement learning to PAR is a valuable research direction.
- Abstract(参考訳): Pedestrian Attribute Recognition (PAR)は、インテリジェントなビデオ監視における課題である。
PARの2つの重要な課題は、画像と属性の複雑なアライメント関係と不均衡なデータ分散である。
既存のアプローチは通常、認識タスクとしてPARを定式化する。
これらと異なり、本論文は強化学習フレームワークによる意思決定タスクとして扱う。
具体的には、PARは、創発的な状態、アクション空間、報酬関数、状態遷移を設計することで、マルコフ決定プロセス(MDP)として定式化される。
属性間不均衡問題を緩和するために、属性を各属性の地域やカテゴリ情報に応じてサブグループに分割してAGS(Attribute Grouping Strategy)を適用する。
次に,各属性群を認識するエージェントを用いて,深層q学習アルゴリズムを用いて学習する。
また, 分布内不均衡問題を軽減するグループ最適化報酬(gor)関数を提案する。
PETA, RAP, PA100Kの3つのベンチマークデータセットに対する実験結果は,提案手法の有効性と競争力を示し, PARへの強化学習の適用が研究上の有益であることを示す。
関連論文リスト
- A Solution to Co-occurrence Bias: Attributes Disentanglement via Mutual
Information Minimization for Pedestrian Attribute Recognition [10.821982414387525]
そこで本研究では,現在の手法が,データセット分布のシーンやアイデンティティに適合する属性の相互依存性の一般化に実際に苦慮していることを示す。
現実的な場面で頑健なモデルをレンダリングするために,属性不整形特徴学習を提案し,属性の認識が他者の存在に依存しないことを保証する。
論文 参考訳(メタデータ) (2023-07-28T01:34:55Z) - PARFormer: Transformer-based Multi-Task Network for Pedestrian Attribute
Recognition [23.814762073093153]
4つのモジュールを含むPARFormerという,純粋なトランスフォーマーベースのマルチタスクPARネットワークを提案する。
特徴抽出モジュールでは,特徴抽出のための強力なベースラインを構築し,複数のPARベンチマークで競合する結果を得る。
視点認識モジュールでは、歩行者属性に対する視点の影響を探索し、マルチビューのコントラスト損失を提案する。
属性認識モジュールでは、負の正の不均衡問題を緩和し、属性予測を生成する。
論文 参考訳(メタデータ) (2023-04-14T16:27:56Z) - A Reinforcement Learning-assisted Genetic Programming Algorithm for Team
Formation Problem Considering Person-Job Matching [70.28786574064694]
解の質を高めるために強化学習支援遺伝的プログラミングアルゴリズム(RL-GP)を提案する。
効率的な学習を通じて得られる超ヒューリスティックなルールは、プロジェクトチームを形成する際の意思決定支援として利用することができる。
論文 参考訳(メタデータ) (2023-04-08T14:32:12Z) - Fairness via Adversarial Attribute Neighbourhood Robust Learning [49.93775302674591]
本稿では,分類ヘッドを損なうために,UnderlineRobust underlineAdversarial underlineAttribute underlineNeighbourhood (RAAN)損失を原則として提案する。
論文 参考訳(メタデータ) (2022-10-12T23:39:28Z) - UPAR: Unified Pedestrian Attribute Recognition and Person Retrieval [4.6193503399184275]
UPAR, Unified Person Attribute Recognition データセットについて述べる。
PA100k、PETA、RAPv2、Market1501の4つの有名な人物属性認識データセットに基づいている。
私たちは、12の属性カテゴリに対して、40の重要なバイナリ属性を調和させるために、3,3Mの追加アノテーションを提供することで、これらのデータセットを統一します。
論文 参考訳(メタデータ) (2022-09-06T14:20:56Z) - Learning to Ask Conversational Questions by Optimizing Levenshtein
Distance [83.53855889592734]
明示的な編集動作によって最小レベンシュテイン距離(MLD)を最適化する強化反復シーケンス編集(RISE)フレームワークを導入する。
RISEは会話の特徴に関連するトークンに注意を払うことができる。
2つのベンチマークデータセットの実験結果から、RISEは最先端の手法を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2021-06-30T08:44:19Z) - Deep Template Matching for Pedestrian Attribute Recognition with the
Auxiliary Supervision of Attribute-wise Keypoints [33.35677385823819]
Pedestrian Attribute Recognition (PAR)は、ビデオ監視のシナリオにおいて重要な役割を担っているため、広く注目を集めている。
最近の研究は、属性に対応する領域をローカライズするための、注意機構やボディ部分の提案など、複雑なモジュールを設計している。
これらの研究は属性特定領域のローカライゼーションがパフォーマンス向上に役立つことを証明している。
しかし、これらの部分情報に基づく手法は、モデル複雑さの増加とともに正確ではない。
論文 参考訳(メタデータ) (2020-11-13T07:52:26Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - Cross-modality Person re-identification with Shared-Specific Feature
Transfer [112.60513494602337]
クロスモダリティの人物再識別(cm-ReID)は、インテリジェントビデオ分析において難しいが重要な技術である。
モーダリティ共有型特徴伝達アルゴリズム (cm-SSFT) を提案し, モーダリティ共有型情報とモーダリティ固有特性の両方のポテンシャルについて検討する。
論文 参考訳(メタデータ) (2020-02-28T00:18:45Z) - Deep Multi-task Multi-label CNN for Effective Facial Attribute
Classification [53.58763562421771]
DMM-CNN(ディープ・マルチタスク・マルチラベル・CNN)による効果的な顔属性分類(FAC)を提案する。
具体的には、DMM-CNNは、2つの密接に関連するタスク(顔のランドマーク検出とFAC)を共同で最適化し、マルチタスク学習を活用することにより、FACの性能を向上させる。
2つの異なるネットワークアーキテクチャは2つの属性のグループの特徴を抽出するために設計され、トレーニング中に各顔属性に損失重みを自動的に割り当てる新しい動的重み付け方式が提案されている。
論文 参考訳(メタデータ) (2020-02-10T12:34:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。