論文の概要: Dense-View GEIs Set: View Space Covering for Gait Recognition based on
Dense-View GAN
- arxiv url: http://arxiv.org/abs/2009.12516v1
- Date: Sat, 26 Sep 2020 04:42:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 08:53:21.327105
- Title: Dense-View GEIs Set: View Space Covering for Gait Recognition based on
Dense-View GAN
- Title(参考訳): Dense-View GEIs Set:Dense-View GANに基づく歩行認識のための空間被覆
- Authors: Rijun Liao, Weizhi An, Shiqi Yu, Zhu Li, Yongzhen Huang
- Abstract要約: 既存の歩行データセットは通常、12の異なる角度でデータを収集する。
Dense-View GEIs Set (DV-GEIs) は、0度から180度までの視角を1度間隔でカバーできる。
この高密度ビューセットを合成するためにDV-GAN(Dense-View GAN)を提案する。
- 参考スコア(独自算出の注目度): 22.090098630196888
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gait recognition has proven to be effective for long-distance human
recognition. But view variance of gait features would change human appearance
greatly and reduce its performance. Most existing gait datasets usually collect
data with a dozen different angles, or even more few. Limited view angles would
prevent learning better view invariant feature. It can further improve
robustness of gait recognition if we collect data with various angles at 1
degree interval. But it is time consuming and labor consuming to collect this
kind of dataset. In this paper, we, therefore, introduce a Dense-View GEIs Set
(DV-GEIs) to deal with the challenge of limited view angles. This set can cover
the whole view space, view angle from 0 degree to 180 degree with 1 degree
interval. In addition, Dense-View GAN (DV-GAN) is proposed to synthesize this
dense view set. DV-GAN consists of Generator, Discriminator and Monitor, where
Monitor is designed to preserve human identification and view information. The
proposed method is evaluated on the CASIA-B and OU-ISIR dataset. The
experimental results show that DV-GEIs synthesized by DV-GAN is an effective
way to learn better view invariant feature. We believe the idea of dense view
generated samples will further improve the development of gait recognition.
- Abstract(参考訳): 歩行認識は長距離人間の認識に有効であることが証明されている。
しかし、歩行の特徴の相違は人間の外観を大きく変え、性能を低下させる。
ほとんどの既存の歩行データセットは、通常、12の異なる角度のデータを収集する。
視野角の制限は、より良い視野不変機能を学ぶことを妨げる。
1度の間隔で様々な角度のデータを収集すれば、歩行認識の堅牢性をさらに向上させることができる。
しかし、この種のデータセットを集めるには時間と労力がかかります。
そこで本稿では,Dense-View GEIs Set (DV-GEIs)を導入し,限られた視野角の課題に対処する。
この集合は1度間隔で0度から180度までの角度の視野空間全体をカバーすることができる。
さらに,Dense-View GAN (DV-GAN) を提案し,この高密度ビューセットを合成した。
DV-GANはジェネレータ、ディスクリミネータ、モニターで構成されており、モニターは人間の識別と視認情報を保存するように設計されている。
提案手法は,CASIA-BおよびOU-ISIRデータセットを用いて評価する。
実験の結果,DV-GANにより合成されたDV-GEIsは,不均一な特徴をよりよく把握するための有効な方法であることがわかった。
濃密なビュー生成サンプルの概念は、歩容認識の発展をさらに改善すると信じている。
関連論文リスト
- AUG: A New Dataset and An Efficient Model for Aerial Image Urban Scene Graph Generation [40.149652254414185]
本稿では,航空画像都市景観グラフ生成(AUG)データセットを構築し,公開する。
AUGデータセットの画像は、低高度のオーバーヘッドビューでキャプチャされる。
複雑な都市景観において局地的な状況が過大評価されるのを避けるため,本稿では,新たな局地性保存グラフ畳み込みネットワーク(LPG)を提案する。
論文 参考訳(メタデータ) (2024-04-11T14:29:30Z) - Semi-Supervised Learning for Visual Bird's Eye View Semantic
Segmentation [16.3996408206659]
トレーニング中にラベルのない画像を活用することで性能を向上させるために,視覚的BEVセマンティックセマンティックセマンティックセマンティクスのための新しい半教師付きフレームワークを提案する。
次に、ラベルのないデータを完全に利用する一貫性損失を提案し、セマンティックな予測だけでなく、BEV機能にもモデルを制約する。
nuScenesとArgoverseデータセットの実験により、我々のフレームワークは予測精度を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2023-08-28T12:23:36Z) - Improving Viewpoint Robustness for Visual Recognition via Adversarial
Training [26.824940629150362]
画像分類器の視点ロバスト性を改善するために,ビューポイント不変適応訓練(VIAT)を提案する。
GMVFool が生成する敵対的視点の多様性に基づいて,VIAT は様々な画像分類器の視点ロバスト性を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-07-21T12:18:35Z) - Unified Visual Relationship Detection with Vision and Language Models [89.77838890788638]
この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデルを活用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
人物体間相互作用検出とシーングラフ生成の双方による実験結果から,本モデルの競合性能が示された。
論文 参考訳(メタデータ) (2023-03-16T00:06:28Z) - Online Deep Clustering with Video Track Consistency [85.8868194550978]
ビデオオブジェクトトラックから視覚的特徴を学習するための教師なしクラスタリングに基づく手法を提案する。
教師なしのクラス非依存でノイズの多いトラックジェネレータを利用すれば、コストと正確なトラックアノテーションに依存するよりも精度が向上することを示す。
論文 参考訳(メタデータ) (2022-06-07T08:11:00Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - Unsupervised View-Invariant Human Posture Representation [28.840986167408037]
本研究では、2次元画像からビュー不変な3次元ポーズ表現を抽出することを学ぶ新しい教師なしアプローチを提案する。
本モデルは,同時フレーム間の人間のポーズの内在的なビュー不変性を活用することで訓練される。
RGB画像と深度画像の非教師なしのクロスビュー動作分類精度の改善を示す。
論文 参考訳(メタデータ) (2021-09-17T19:23:31Z) - Occlusion-Invariant Rotation-Equivariant Semi-Supervised Depth Based
Cross-View Gait Pose Estimation [40.50555832966361]
閉塞不変な半教師あり学習フレームワークを用いたクロスビュー一般化のための新しい手法を提案する。
本モデルは,1つの視点からの実世界データと,複数の視点からの非競合合成データを用いて訓練した。
他の目に見えないすべてのビューから、現実世界のデータをうまく一般化することができる。
論文 参考訳(メタデータ) (2021-09-03T09:39:05Z) - Vision-Language Navigation with Random Environmental Mixup [112.94609558723518]
視覚言語ナビゲーション(VLN)タスクは、視覚的な観察を認識し、自然言語の命令を解釈しながら、エージェントがステップバイステップでナビゲートする必要がある。
従来の研究では、データのバイアスを減らすために様々なデータ拡張手法が提案されている。
本研究では,混成環境を介し,相互接続された住宅シーンを付加データとして生成するランダム環境混成(REM)手法を提案する。
論文 参考訳(メタデータ) (2021-06-15T04:34:26Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - Towards End-to-end Video-based Eye-Tracking [50.0630362419371]
画像のみから視線を推定することは、観察不可能な人固有の要因のために難しい課題である。
本稿では,これらの意味的関係と時間的関係を明確に学習することを目的とした,新しいデータセットとアタッチメント手法を提案する。
視覚刺激からの情報と視線画像の融合が,文献に記録された人物と同じような性能を達成することにつながることを実証した。
論文 参考訳(メタデータ) (2020-07-26T12:39:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。