論文の概要: Optimizing Camera Configurations for Multi-View Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2312.02144v1
- Date: Mon, 4 Dec 2023 18:59:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 13:53:35.835518
- Title: Optimizing Camera Configurations for Multi-View Pedestrian Detection
- Title(参考訳): 多視点歩行者検出のためのカメラ構成最適化
- Authors: Yunzhong Hou, Xingjian Leng, Tom Gedeon, Liang Zheng
- Abstract要約: 本研究では,トランス方式のカメラ構成生成器を特徴とする新しいソリューションを提案する。
強化学習を用いて、このジェネレータは、アクション空間内の広大な組み合わせを自律的に探索し、最も高い検出精度を与える構成を探索する。
複数のシミュレーションシナリオにおいて、トランスフォーマーモデルによって生成された構成は、人間の専門家が設計したランダム検索、最適化、構成よりも一貫して優れています。
- 参考スコア(独自算出の注目度): 21.89117952343898
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Jointly considering multiple camera views (multi-view) is very effective for
pedestrian detection under occlusion. For such multi-view systems, it is
critical to have well-designed camera configurations, including camera
locations, directions, and fields-of-view (FoVs). Usually, these configurations
are crafted based on human experience or heuristics. In this work, we present a
novel solution that features a transformer-based camera configuration
generator. Using reinforcement learning, this generator autonomously explores
vast combinations within the action space and searches for configurations that
give the highest detection accuracy according to the training dataset. The
generator learns advanced techniques like maximizing coverage, minimizing
occlusion, and promoting collaboration. Across multiple simulation scenarios,
the configurations generated by our transformer-based model consistently
outperform random search, heuristic-based methods, and configurations designed
by human experts, shedding light on future camera layout optimization.
- Abstract(参考訳): 複数のカメラビュー(マルチビュー)を共同で考えることは、閉塞下の歩行者検出に非常に効果的である。
このようなマルチビューシステムでは、カメラの位置、方向、視野(FoV)など、よく設計されたカメラ構成を持つことが重要である。
通常、これらの構成は人間の経験やヒューリスティックに基づいている。
本稿では,トランスフォーマーを用いたカメラ構成生成装置を特徴とする新しいソリューションを提案する。
強化学習を用いて、このジェネレータは、アクション空間内の膨大な組み合わせを自律的に探索し、トレーニングデータセットに従って最も高い検出精度を与える構成を探索する。
ジェネレータは、カバレッジの最大化、咬合の最小化、コラボレーションの促進といった高度な技術を学ぶ。
複数のシミュレーションシナリオにおいて、トランスフォーマーベースモデルによって生成された構成は、ランダム検索、ヒューリスティックベースの手法、そして人間の専門家が設計した構成を一貫して上回り、将来のカメラレイアウトの最適化に光を当てる。
関連論文リスト
- Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering [54.468355408388675]
カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築した。
カメラ選択を最適化するために,多様性に基づくサンプリングアルゴリズムを適用した。
IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが含まれています。
論文 参考訳(メタデータ) (2024-09-11T08:36:49Z) - RETINA: a hardware-in-the-loop optical facility with reduced optical aberrations [0.0]
視覚に基づくナビゲーションアルゴリズムは、低コストで汎用的なセンサーで軌道上の宇宙船の状態を決定する効果的な解決策として自らを確立している。
実験室で軌道環境をエミュレートするために、専用のシミュレーションフレームワークを開発する必要がある。
本稿では,RETINAと呼ばれる低収差光学設備の設計について述べる。
論文 参考訳(メタデータ) (2024-07-02T11:26:37Z) - City-Scale Multi-Camera Vehicle Tracking System with Improved Self-Supervised Camera Link Model [0.0]
本稿では,自己監督型カメラリンクモデルを用いた,革新的なマルチカメラ車両追跡システムを提案する。
提案手法は,61.07%のIDF1スコアを有するCityFlow V2ベンチマークにおいて,自動カメラリンク方式の最先端性を実現する。
論文 参考訳(メタデータ) (2024-05-18T17:28:35Z) - Toward Global Sensing Quality Maximization: A Configuration Optimization
Scheme for Camera Networks [15.795407587722924]
パラメータ化カメラネットワークモデルの再構成戦略について検討する。
我々は、カメラネットワークによる目標のセンシング品質を測定する単一の量を形成する。
広範囲なシミュレーションと実験により,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-11-28T09:21:47Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - CNN-based Omnidirectional Object Detection for HermesBot Autonomous
Delivery Robot with Preliminary Frame Classification [53.56290185900837]
予備的バイナリフレーム分類を用いた物体検出のためのニューラルネットワークの最適化アルゴリズムを提案する。
周囲に6台のローリングシャッターカメラを備えた自律移動ロボットを360度視野として実験装置として使用した。
論文 参考訳(メタデータ) (2021-10-22T15:05:37Z) - DeepMultiCap: Performance Capture of Multiple Characters Using Sparse
Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。
本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文 参考訳(メタデータ) (2021-05-01T14:32:13Z) - Infrastructure-based Multi-Camera Calibration using Radial Projections [117.22654577367246]
パターンベースのキャリブレーション技術は、カメラの内在を個別にキャリブレーションするために使用することができる。
Infrastucture-based calibration techniqueはSLAMやStructure-from-Motionで事前に構築した3Dマップを用いて外部情報を推定することができる。
本稿では,インフラストラクチャベースのアプローチを用いて,マルチカメラシステムをスクラッチから完全にキャリブレーションすることを提案する。
論文 参考訳(メタデータ) (2020-07-30T09:21:04Z) - Redesigning SLAM for Arbitrary Multi-Camera Systems [51.81798192085111]
SLAMシステムにより多くのカメラを追加することで、堅牢性と精度が向上するが、視覚的なフロントエンドの設計は大幅に複雑になる。
本研究では,任意のマルチカメラ装置で動作する適応SLAMシステムを提案する。
これらの修正を応用した最先端の視覚慣性計測装置を試作し, 改良したパイプラインが広い範囲のカメラ装置に適応可能であることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-03-04T11:44:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。