論文の概要: Pedestrian Tracking with Monocular Camera using Unconstrained 3D Motion Model
- arxiv url: http://arxiv.org/abs/2403.11978v1
- Date: Mon, 18 Mar 2024 17:13:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 19:20:58.331179
- Title: Pedestrian Tracking with Monocular Camera using Unconstrained 3D Motion Model
- Title(参考訳): 非拘束3次元運動モデルを用いた単眼カメラによる歩行者追跡
- Authors: Jan Krejčí, Oliver Kost, Ondřej Straka, Jindřich Duník,
- Abstract要約: 移動物体の広さは、歩行者の高さなどの3次元の既知の統計によって説明できると仮定される。
このモデルのための非線形フィルタは、無人カルマンフィルタ(UKF)を用いて実装され、公開されているMOT-17データセットを用いてテストされる。
提案手法は, 2次元画像に投影された場合, 完全な結果を維持しつつ, 3次元で有望な結果が得られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A first-principle single-object model is proposed for pedestrian tracking. It is assumed that the extent of the moving object can be described via known statistics in 3D, such as pedestrian height. The proposed model thus need not constrain the object motion in 3D to a common ground plane, which is usual in 3D visual tracking applications. A nonlinear filter for this model is implemented using the unscented Kalman filter (UKF) and tested using the publicly available MOT-17 dataset. The proposed solution yields promising results in 3D while maintaining perfect results when projected into the 2D image. Moreover, the estimation error covariance matches the true one. Unlike conventional methods, the introduced model parameters have convenient meaning and can readily be adjusted for a problem.
- Abstract(参考訳): 歩行者追跡のための第一原理単目的モデルを提案する。
移動物体の広さは、歩行者の高さなどの3次元の既知の統計によって説明できると仮定される。
提案したモデルでは3次元の物体の動きを共通の地上面に制約する必要はない。
このモデルのための非線形フィルタは、無人カルマンフィルタ(UKF)を用いて実装され、公開されているMOT-17データセットを用いてテストされる。
提案手法は, 2次元画像に投影された場合, 完全な結果を維持しつつ, 3次元で有望な結果が得られる。
さらに、推定誤差の共分散は真に一致する。
従来の手法とは異なり、導入されたモデルパラメータは便利な意味を持ち、問題に対して容易に調整できる。
関連論文リスト
- Measuring the Discrepancy between 3D Geometric Models using Directional
Distance Fields [98.15456815880911]
本稿では,DirDistを提案する。DirDistは3次元幾何データに対して,効率的で効果的で,頑健で,微分可能な距離測定法である。
一般的な距離計量として、DirDistは3次元幾何学モデリングの分野を前進させる可能性がある。
論文 参考訳(メタデータ) (2024-01-18T05:31:53Z) - 6D Object Pose Estimation from Approximate 3D Models for Orbital
Robotics [19.64111218032901]
単一画像から物体の6次元ポーズを推定する新しい手法を提案する。
画素毎に3次元モデル座標を回帰する高密度な2次元から3次元対応予測器を用いる。
提案手法は,SPEED+データセット上での最先端性能を実現し,SPEC2021ポストモーテムコンペティションで優勝した。
論文 参考訳(メタデータ) (2023-03-23T13:18:05Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries [43.02373021724797]
マルチカメラ3Dオブジェクト検出のためのフレームワークを提案する。
本手法は3次元空間での予測を直接操作する。
我々はnuScenes自動運転ベンチマークで最先端の性能を達成する。
論文 参考訳(メタデータ) (2021-10-13T17:59:35Z) - AutoShape: Real-Time Shape-Aware Monocular 3D Object Detection [15.244852122106634]
形状認識型2D/3D制約を3D検出フレームワークに組み込む手法を提案する。
具体的には、ディープニューラルネットワークを用いて、2次元画像領域の区別された2Dキーポイントを学習する。
2D/3Dキーポイントの基礎的真理を生成するために、自動的なモデル適合手法が提案されている。
論文 参考訳(メタデータ) (2021-08-25T08:50:06Z) - Probabilistic Monocular 3D Human Pose Estimation with Normalizing Flows [24.0966076588569]
本稿では,不明瞭な逆2D-to-3D問題を解くために,決定論的3D-to-2Dマッピングを利用する正規化フローベース手法を提案する。
我々は、Human3.6MとMPI-INF-3DHPの2つのベンチマークデータセットに対するアプローチを評価し、ほとんどの指標において同等の手法を上回りました。
論文 参考訳(メタデータ) (2021-07-29T07:33:14Z) - A Framework for 3D Tracking of Frontal Dynamic Objects in Autonomous
Cars [0.0]
本論文では, YOLOv3 アプローチを OpenCV トラッカーの横に使用し, 画像から特徴を引き出す。
横距離と縦距離を得るため、状態依存リッカティ方程式フィルタと並行して非線形sfmモデルを考える。
SDREフィルタの堅牢な性能を高めるために, スイッチング推定誤差共分散方式のスイッチング方式を提案する。
論文 参考訳(メタデータ) (2021-03-24T18:21:29Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。