論文の概要: Three-dimensional Human Tracking of a Mobile Robot by Fusion of Tracking
Results of Two Cameras
- arxiv url: http://arxiv.org/abs/2007.01514v1
- Date: Fri, 3 Jul 2020 06:46:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 06:04:56.921702
- Title: Three-dimensional Human Tracking of a Mobile Robot by Fusion of Tracking
Results of Two Cameras
- Title(参考訳): 2台のカメラの追跡結果の融合による移動ロボットの3次元追跡
- Authors: Shinya Matsubara, Akihiko Honda, Yonghoon Ji, Kazunori Umeda
- Abstract要約: OpenPoseは人間の検出に使われる。
この問題に対処するための新しいステレオビジョンフレームワークが提案されている。
提案手法の有効性を目標追跡実験により検証した。
- 参考スコア(独自算出の注目度): 0.860255319568951
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a process that uses two cameras to obtain
three-dimensional (3D) information of a target object for human tracking.
Results of human detection and tracking from two cameras are integrated to
obtain the 3D information. OpenPose is used for human detection. In the case of
a general processing a stereo camera, a range image of the entire scene is
acquired as precisely as possible, and then the range image is processed.
However, there are problems such as incorrect matching and computational cost
for the calibration process. A new stereo vision framework is proposed to cope
with the problems. The effectiveness of the proposed framework and the method
is verified through target-tracking experiments.
- Abstract(参考訳): 本稿では,2台のカメラを用いて対象物体の3次元情報を取得する手法を提案する。
2台のカメラからの人間の検出と追跡の結果を統合して3D情報を得る。
OpenPoseは人間の検出に使われる。
一般的なステレオカメラ処理の場合、シーン全体のレンジ画像ができるだけ正確に取得され、レンジ画像が処理される。
しかし、校正過程における不正確なマッチングや計算コストといった問題もある。
この問題に対処するための新しいステレオビジョンフレームワークが提案されている。
提案手法の有効性を目標追跡実験により検証した。
関連論文リスト
- MonoSOWA: Scalable monocular 3D Object detector Without human Annotations [0.0]
そこで本研究では,ドメイン固有のアノテーションを使わずに,単眼のRGBカメラに3Dオブジェクト検出器をトレーニングする手法を提案する。
新たに提案されたCanonical Object Spaceのおかげで、この手法は、さまざまなデータセットやカメラのセットアップにまたがるデータを利用して、単一の3D検出器を訓練するだけでなく、これまでは見えなかったカメラのセットアップでも使える。
論文 参考訳(メタデータ) (2025-01-16T11:35:22Z) - SDGE: Stereo Guided Depth Estimation for 360$^\circ$ Camera Sets [65.64958606221069]
マルチカメラシステムは、360ドル周の知覚を達成するために、しばしば自律走行に使用される。
360ドル(約3万3000円)のカメラセットは、しばしば制限または低品質のオーバーラップ領域を持ち、画像全体に対してマルチビューステレオメソッドを実現する。
重なりの重なりに多視点ステレオ結果を明示的に利用することにより、全画像の深さ推定を強化するステレオガイド深度推定法(SGDE)を提案する。
論文 参考訳(メタデータ) (2024-02-19T02:41:37Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - 3D Human Pose Estimation in Multi-View Operating Room Videos Using
Differentiable Camera Projections [2.486571221735935]
本稿では,3次元の損失に基づいて2次元CNNをエンドツーエンドにトレーニングすることで,3次元のローカライゼーションを直接最適化することを提案する。
MVORデータセットの動画を用いて、このエンドツーエンドアプローチが2次元空間での最適化より優れていることを示す。
論文 参考訳(メタデータ) (2022-10-21T09:00:02Z) - Aerial Monocular 3D Object Detection [67.20369963664314]
DVDETは2次元画像空間と3次元物理空間の両方で空中単分子3次元物体検出を実現するために提案される。
高度視差変形問題に対処するため,新しい測地変形変換モジュールを提案する。
より多くの研究者がこの領域を調査するよう促すため、データセットと関連するコードをリリースします。
論文 参考訳(メタデータ) (2022-08-08T08:32:56Z) - People Tracking in Panoramic Video for Guiding Robots [2.092922495279074]
ガイドロボットは、おそらく未知の環境の特定の場所への移動を効果的に行うことを目的としている。
この操作の間、ロボットは、付随する人物を検出し、追跡し、彼女/彼の姿を見失おうとはしない。
360deg Field of View (FoV)は、あらゆるフレームオブジェクトがセンサーから外されたり、遠く離れていなければ、FoVを離れることができないことを保証します。
我々は、視線カメラ用に設計された標準的な人検出・追跡パイプラインであるパノラマビデオに効果的に適応できる一連の手法を提案する。
論文 参考訳(メタデータ) (2022-06-06T16:44:38Z) - Rope3D: TheRoadside Perception Dataset for Autonomous Driving and
Monocular 3D Object Detection Task [48.555440807415664]
道路沿いの知覚3Dデータセットに挑戦する最初のハイダイバーシティを提示する。
データセットは50Kイメージと、さまざまなシーンで1.5M以上の3Dオブジェクトで構成されている。
本稿では,様々なセンサや視点によって引き起こされるあいまいさを解決するために,幾何学的制約を活用することを提案する。
論文 参考訳(メタデータ) (2022-03-25T12:13:23Z) - Monocular 3D Vehicle Detection Using Uncalibrated Traffic Cameras
through Homography [12.062095895630563]
本稿では,1台の交通カメラから3次元世界における車両の位置とポーズを抽出する手法を提案する。
道路平面と画像平面の相同性が3D車両の検出に不可欠であることを観察する。
本稿では,BEV画像の歪み検出精度を高めるためのtextittailedr-box と textitdual-view Network アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-03-29T02:57:37Z) - Simultaneous Multi-View Camera Pose Estimation and Object Tracking with
Square Planar Markers [0.0]
本稿では,上記の問題を同時に解く新しい手法を提案する。
複数のカメラから記録された平面マーカーの厳密な集合を示すビデオシーケンスから,提案手法はマーカーの3次元構成を自動的に得ることができる。
パラメータが取得されると、オブジェクトの追跡は、低い計算コストでリアルタイムで行うことができます。
論文 参考訳(メタデータ) (2021-03-16T15:33:58Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - BirdNet+: End-to-End 3D Object Detection in LiDAR Bird's Eye View [117.44028458220427]
自動運転車のオンボード3Dオブジェクト検出は、LiDARデバイスが捉えた幾何学情報に依存することが多い。
本稿では,BEV画像のみから指向性3Dボックスを推測可能な,エンドツーエンドの3Dオブジェクト検出フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-09T15:08:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。