論文の概要: Segmentation-Based Bounding Box Generation for Omnidirectional
Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2104.13764v1
- Date: Wed, 28 Apr 2021 13:53:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 12:45:41.245618
- Title: Segmentation-Based Bounding Box Generation for Omnidirectional
Pedestrian Detection
- Title(参考訳): 一方向歩行者検出のためのセグメンテーションベースバウンディングボックス生成
- Authors: Masato Tamura, Tomoaki Yoshinaga
- Abstract要約: 全方向歩行者検出のためのセグメンテーションに基づく境界ボックス生成法を提案する。
全方位画像における歩行者の出現は任意の角度に回転する可能性があるため、一般的な歩行者検知器の性能は著しく劣化する可能性が高い。
既存の方法は、推論中に画像を変換したり、全方向画像で検出器を訓練することでこの問題を緩和します。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a segmentation-based bounding box generation method for
omnidirectional pedestrian detection, which enables detectors to tightly fit
bounding boxes to pedestrians without omnidirectional images for training.
Because the appearance of pedestrians in omnidirectional images may be rotated
to any angle, the performance of common pedestrian detectors is likely to be
substantially degraded. Existing methods mitigate this issue by transforming
images during inference or training detectors with omnidirectional images.
However, the first approach substantially degrades the inference speed, and the
second approach requires laborious annotations. To overcome these drawbacks, we
leverage an existing large-scale dataset, whose segmentation annotations can be
utilized, to generate tightly fitted bounding box annotations. We also develop
a pseudo-fisheye distortion augmentation method, which further enhances the
performance. Extensive analysis shows that our detector successfully fits
bounding boxes to pedestrians and demonstrates substantial performance
improvement.
- Abstract(参考訳): そこで本研究では,全方位歩行者検出のためのセグメンテーションに基づく境界ボックス生成法を提案する。
全方位画像における歩行者の出現は任意の角度に回転する可能性があるため、一般的な歩行者検知器の性能は著しく劣化する可能性が高い。
既存の方法は、推論中に画像を変換したり、全方位画像で検出器を訓練することで、この問題を軽減する。
しかし、第1のアプローチは推論速度を著しく低下させ、第2のアプローチは退屈なアノテーションを必要とする。
これらの欠点を克服するために,セグメンテーションアノテーションを活用可能な既存の大規模データセットを活用して,バウンディングボックスアノテーションを厳密に生成する。
また,擬似魚眼歪み増大法を開発し,その性能をさらに向上させる。
広範囲な分析により,我々の検出器は歩行者にバウンディングボックスを適合させることに成功し,大幅な性能向上を示した。
関連論文リスト
- Zone Evaluation: Revealing Spatial Bias in Object Detection [69.59295428233844]
物体検出器の基本的限界は、それらが「空間バイアス」に苦しむことである。
本稿では,ゾーン間の検出性能を計測する新しいゾーン評価プロトコルを提案する。
初めて数値的な結果が得られ、対象検出器はゾーンにわたって非常に不均一に機能することを示した。
論文 参考訳(メタデータ) (2023-10-20T01:44:49Z) - Traditional methods in Edge, Corner and Boundary detection [0.0]
エッジ、コーナー、境界検出の多くの実世界の応用がある。
自動運転車のような現代のイノベーションでは、エッジ検出とセグメンテーションが最も重要になっている。
実世界の画像は検出器の性能と限界を検証するために使用される。
論文 参考訳(メタデータ) (2022-08-12T22:26:05Z) - Cross-Camera Trajectories Help Person Retrieval in a Camera Network [124.65912458467643]
既存の手法では、純粋な視覚的マッチングや時間的制約を考慮することが多いが、カメラネットワークの空間情報は無視する。
本稿では,時間的情報と空間的情報を統合したクロスカメラ生成に基づく歩行者検索フレームワークを提案する。
本手法の有効性を検証するため,最初のカメラ横断歩行者軌跡データセットを構築した。
論文 参考訳(メタデータ) (2022-04-27T13:10:48Z) - End-to-End Instance Edge Detection [29.650295133113183]
エッジ検出は長い間、コンピュータビジョンの分野で重要な問題であった。
従来の研究は、カテゴリ非依存またはカテゴリ対応エッジ検出を探索してきた。
本稿では,オブジェクトインスタンスのコンテキストにおけるエッジ検出について検討する。
論文 参考訳(メタデータ) (2022-04-06T15:32:21Z) - ARPD: Anchor-free Rotation-aware People Detection using Topview Fisheye
Camera [3.0868856870169625]
本研究では,魚眼画像中の任意回転者を検知する単一段アンカーフリー完全畳み込みネットワークARPDを提案する。
提案手法は最先端のアルゴリズムと非常に高速に動作しながら競合する。
論文 参考訳(メタデータ) (2022-01-25T05:49:50Z) - Pedestrian Detection: Domain Generalization, CNNs, Transformers and
Beyond [82.37430109152383]
その結果、現在の歩行者検知器は、クロスデータセット評価において、たとえ小さな領域シフトであっても処理が不十分であることがわかった。
限定的な一般化は、その方法と現在のデータ源の2つの主要な要因に帰着する。
本稿では、一般化を改善する進歩的な微調整戦略を提案する。
論文 参考訳(メタデータ) (2022-01-10T06:00:26Z) - Cross-Camera Feature Prediction for Intra-Camera Supervised Person
Re-identification across Distant Scenes [70.30052164401178]
人物再識別(Re-ID)は、重複しないカメラビュー間で人物画像をマッチングすることを目的としている。
ICS-DS Re-IDは、カメラ内IDラベル付きクロスカメラアンペアデータを使用してトレーニングを行う。
カメラ横断型自己監視情報マイニングのためのクロスカメラ特徴予測法
グローバルレベルの特徴とローカルレベルの特徴の合同学習は、グローバルなローカルなクロスカメラ特徴予測スキームを形成する。
論文 参考訳(メタデータ) (2021-07-29T11:27:50Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z) - Deep Soft Procrustes for Markerless Volumetric Sensor Alignment [81.13055566952221]
本研究では、より堅牢なマルチセンサ空間アライメントを実現するために、マーカーレスデータ駆動対応推定を改善する。
我々は、幾何学的制約を終末的に典型的なセグメンテーションベースモデルに組み込み、対象のポーズ推定タスクと中間密な分類タスクをブリッジする。
実験により,マーカーベースの手法で同様の結果が得られ,マーカーレス手法よりも優れ,またキャリブレーション構造のポーズ変動にも頑健であることがわかった。
論文 参考訳(メタデータ) (2020-03-23T10:51:32Z) - Detecting Lane and Road Markings at A Distance with Perspective
Transformer Layers [5.033948921121557]
既存の手法では、検出精度は距離の増大とともに劣化することが多い。
これは、遠車線や道路標識が画像中の少数のピクセルを占有しているためである。
逆のパースペクティブマッピングは、パースペクティブの歪みを取り除くために使用できるが、本質的にはアーティファクトに繋がる可能性がある。
論文 参考訳(メタデータ) (2020-03-19T03:22:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。