論文の概要: Weakly Supervised Dataset Collection for Robust Person Detection
- arxiv url: http://arxiv.org/abs/2003.12263v2
- Date: Fri, 1 May 2020 07:35:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 05:01:52.940679
- Title: Weakly Supervised Dataset Collection for Robust Person Detection
- Title(参考訳): ロバストな人物検出のための弱修正データセットコレクション
- Authors: Munetaka Minoguchi, Ken Okayama, Yutaka Satoh, Hirokatsu Kataoka
- Abstract要約: 弱教師付きで生成した800万以上の画像からなるデータセットを提示する。
我々は2段階の収集プロセスに基づいて870万枚の人物画像を収集した。
- 参考スコア(独自算出の注目度): 15.821051166116977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To construct an algorithm that can provide robust person detection, we
present a dataset with over 8 million images that was produced in a weakly
supervised manner. Through labor-intensive human annotation, the person
detection research community has produced relatively small datasets containing
on the order of 100,000 images, such as the EuroCity Persons dataset, which
includes 240,000 bounding boxes. Therefore, we have collected 8.7 million
images of persons based on a two-step collection process, namely person
detection with an existing detector and data refinement for false positive
suppression. According to the experimental results, the Weakly Supervised
Person Dataset (WSPD) is simple yet effective for person detection
pre-training. In the context of pre-trained person detection algorithms, our
WSPD pre-trained model has 13.38 and 6.38% better accuracy than the same model
trained on the fully supervised ImageNet and EuroCity Persons datasets,
respectively, when verified with the Caltech Pedestrian.
- Abstract(参考訳): 頑健な人物検出を実現するアルゴリズムを構築するために,弱教師付きで生成した800万以上の画像からなるデータセットを提案する。
労働集約型の人的アノテーションを通じて、人物検出研究コミュニティは、24万のバウンディングボックスを含むユーロシティパーソンデータセットなど、10万枚の画像を含む比較的小さなデータセットを作成した。
そこで我々は,既存の検出器による人物検出と偽陽性抑制のためのデータの精細化という2段階の収集プロセスに基づいて,870万枚の人物像を収集した。
実験結果によると、Wakly Supervised Person Dataset (WSPD) は単純だが、事前学習による人検出には有効である。
事前訓練された人物検出アルゴリズムの文脈では、当社のWSPD事前訓練モデルは、カルテック・ペデストリアン(Caltech Pedestrian)で検証された際に、フル教師付きImageNetとEuroCity Personsデータセットでトレーニングされた同じモデルよりも13.38と6.38%精度がある。
関連論文リスト
- Improved detection of discarded fish species through BoxAL active learning [0.2544632696242629]
本研究では,より高速なR-CNNオブジェクト検出モデルの認識精度を推定する,BoxALという能動的学習手法を提案する。
この方法では、未ラベルのプールから最も不確実なトレーニングイメージを選択し、オブジェクト検出モデルのトレーニングに使用することができる。
また,本研究では,サンプル化した新データが,未ラベルデータよりもトレーニングに有用であることが確認された。
論文 参考訳(メタデータ) (2024-10-07T10:01:30Z) - Disentangled Pre-training for Human-Object Interaction Detection [22.653500926559833]
本稿では,DP-HOI検出のための非交互事前学習法を提案する。
DP-HOIは、オブジェクト検出とアクション認識データセットを使用して、検出およびインタラクションデコーダ層を事前トレーニングする。
これは、様々な稀なカテゴリにおける既存のHOI検出モデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2024-04-02T08:21:16Z) - Divide and Conquer: Hybrid Pre-training for Person Search [40.13016375392472]
本研究では,サブタスクデータのみを用いた人物検索のためのハイブリッド事前学習フレームワークを提案する。
我々のモデルは、人物探索法、微調整データ、事前学習データ、モデルバックボーンなど、多様なプロトコルで大幅に改善できる。
私たちのコードと事前訓練されたモデルは、人検索コミュニティにプラグイン・アンド・プレイの使用のためにリリースされます。
論文 参考訳(メタデータ) (2023-12-13T08:33:50Z) - PDIWS: Thermal Imaging Dataset for Person Detection in Intrusion Warning
Systems [0.0]
データセットは2000イメージのトレーニングセットと500イメージのテストセットで構成されている。
全50の背景があり、1000人近い被験者は5つのポーズに従って5つのクラスに分けられる。
最初の4つのポーズが検出された場合、侵入者の存在を確認する。
論文 参考訳(メタデータ) (2023-02-26T11:02:34Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Self-Supervised Learning as a Means To Reduce the Need for Labeled Data
in Medical Image Analysis [64.4093648042484]
胸部X線画像のデータセットとバウンディングボックスラベルを用いて,13種類の異常の分類を行った。
ラベル付きデータの平均精度と精度を60%に抑えることで,完全教師付きモデルと同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2022-06-01T09:20:30Z) - DAD: Data-free Adversarial Defense at Test Time [21.741026088202126]
ディープモデルは敵の攻撃に非常に敏感である。
プライバシは、トレーニングデータではなく、トレーニングされたモデルのみへのアクセスを制限する、重要な関心事になっている。
我々は,「訓練データと統計値の欠如によるテスト時敵防衛」という全く新しい問題を提案する。
論文 参考訳(メタデータ) (2022-04-04T15:16:13Z) - Active Learning of Neural Collision Handler for Complex 3D Mesh
Deformations [68.0524382279567]
3次元変形メッシュにおける衝突の検出と処理を行う頑健な学習アルゴリズムを提案する。
提案手法は教師あり学習法より優れ, 精度は93.8-98.1%である。
論文 参考訳(メタデータ) (2021-10-08T04:08:31Z) - Unsupervised Noisy Tracklet Person Re-identification [100.85530419892333]
本稿では,非照合トラックレットデータから識別的人物再識別モデルを訓練できる選択的トラックレット学習(STL)手法を提案する。
これにより、カメラビュー全体で人物の画像/トラックレットの真のマッチングペアを完全にラベル付けする面倒でコストのかかるプロセスが回避されます。
提案手法は生トラックレットの任意のノイズデータに対して特に頑健であるため,制約のない追跡データから識別モデル学習にスケーラブルである。
論文 参考訳(メタデータ) (2021-01-16T07:31:00Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Detection in Crowded Scenes: One Proposal, Multiple Predictions [79.28850977968833]
混み合ったシーンにおける高過度なインスタンスを検出することを目的とした,提案手法によるオブジェクト検出手法を提案する。
このアプローチの鍵は、各提案が以前の提案ベースのフレームワークの1つではなく、関連したインスタンスのセットを予測できるようにすることです。
我々の検出器は、CrowdHumanデータセットの挑戦に対して4.9%のAPゲインを得ることができ、CityPersonsデータセットでは1.0%$textMR-2$の改善がある。
論文 参考訳(メタデータ) (2020-03-20T09:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。