論文の概要: A Flexible Multi-view Multi-modal Imaging System for Outdoor Scenes
- arxiv url: http://arxiv.org/abs/2302.10465v1
- Date: Tue, 21 Feb 2023 06:14:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 16:15:59.122735
- Title: A Flexible Multi-view Multi-modal Imaging System for Outdoor Scenes
- Title(参考訳): 屋外シーンのためのフレキシブルマルチビューマルチモーダルイメージングシステム
- Authors: Meng Zhang, Wenxuan Guo, Bohao Fan, Yifan Chen, Jianjiang Feng and Jie
Zhou
- Abstract要約: 大規模な屋外シーンに適用可能な無線マルチビューマルチモーダル3Dイメージングシステムを提案する。
カメラとLiDARを備えた複数の空間分散スレーブノードが接続され、無線センサネットワークを形成する。
このシステムは、ミュートリビューRGBカメラとLiDARを大規模な屋外シーンで統合した最初の撮像システムである。
- 参考スコア(独自算出の注目度): 37.5716419191546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-view imaging systems enable uniform coverage of 3D space and reduce the
impact of occlusion, which is beneficial for 3D object detection and tracking
accuracy. However, existing imaging systems built with multi-view cameras or
depth sensors are limited by the small applicable scene and complicated
composition. In this paper, we propose a wireless multi-view multi-modal 3D
imaging system generally applicable to large outdoor scenes, which consists of
a master node and several slave nodes. Multiple spatially distributed slave
nodes equipped with cameras and LiDARs are connected to form a wireless sensor
network. While providing flexibility and scalability, the system applies
automatic spatio-temporal calibration techniques to obtain accurate 3D
multi-view multi-modal data. This system is the first imaging system that
integrates mutli-view RGB cameras and LiDARs in large outdoor scenes among
existing 3D imaging systems. We perform point clouds based 3D object detection
and long-term tracking using the 3D imaging dataset collected by this system.
The experimental results show that multi-view point clouds greatly improve 3D
object detection and tracking accuracy regardless of complex and various
outdoor environments.
- Abstract(参考訳): マルチビューイメージングシステムは3次元空間の均一なカバレッジを可能にし、咬合の影響を低減し、3次元物体検出と追跡精度に有用である。
しかし、マルチビューカメラや奥行きセンサーを備えた既存の撮像システムは、小さなシーンと複雑な構成によって制限されている。
本稿では,マスタノードと複数のスレーブノードからなる大規模屋外シーンに適用可能な無線マルチビューマルチモーダル3Dイメージングシステムを提案する。
カメラとLiDARを備えた複数の空間分散スレーブノードを接続して無線センサネットワークを形成する。
柔軟性とスケーラビリティを提供しながら、正確な3次元マルチビューマルチモーダルデータを得るために、自動時空間キャリブレーション技術を適用している。
このシステムは、既存の3Dイメージングシステムのうち、大きな屋外シーンでミュートリビューRGBカメラとLiDARを統合する最初の撮像システムである。
本システムで収集した3次元画像データセットを用いて,ポイントクラウドに基づく3次元物体検出と長期追跡を行う。
実験の結果,多視点雲は複雑な屋外環境や様々な屋外環境に関わらず,3次元物体検出と追跡精度を大幅に向上することがわかった。
関連論文リスト
- VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection [80.62052650370416]
モノクル3Dオブジェクト検出は、自律運転やロボティクスなど、さまざまなアプリケーションにおいて重要な役割を担っている。
本稿では,VFMM3Dを提案する。VFMM3Dは,ビジョンファウンデーションモデル(VFM)の機能を利用して,単一ビュー画像を正確にLiDARポイントクラウド表現に変換する,革新的なフレームワークである。
論文 参考訳(メタデータ) (2024-04-15T03:12:12Z) - Sparse Points to Dense Clouds: Enhancing 3D Detection with Limited LiDAR Data [68.18735997052265]
単分子と点雲に基づく3次元検出の利点を組み合わせたバランスの取れたアプローチを提案する。
本手法では,低コストで低解像度のセンサから得られる3Dポイントを少数必要としている。
3次元検出の精度は最先端の単分子検出法と比較して20%向上する。
論文 参考訳(メタデータ) (2024-04-10T03:54:53Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - Weakly Supervised 3D Multi-person Pose Estimation for Large-scale Scenes
based on Monocular Camera and Single LiDAR [41.39277657279448]
大規模シーンにおける3次元多人数ポーズ推定のためのモノクロカメラとLiDARによる単一手法を提案する。
具体的には,画像や点クラウドを含むマルチモーダル入力データを活用するための効果的な融合戦略を設計する。
本手法は, 点雲の固有な幾何学的制約を自己監督のために利用し, 画像上の2次元キーポイントを弱監督のために利用する。
論文 参考訳(メタデータ) (2022-11-30T12:50:40Z) - Scatter Points in Space: 3D Detection from Multi-view Monocular Images [8.71944437852952]
単眼画像からの3次元物体検出は,コンピュータビジョンの課題であり,長年の課題である。
近年の手法では, 空間に密集した正規3次元格子をサンプリングすることにより, マルチビュー特性を集約する傾向にある。
そこで本研究では,データ空間に擬似曲面点を散布し,データの分散性を維持するための学習可能なキーポイントサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-08-31T09:38:05Z) - PC-DAN: Point Cloud based Deep Affinity Network for 3D Multi-Object
Tracking (Accepted as an extended abstract in JRDB-ACT Workshop at CVPR21) [68.12101204123422]
点雲は3次元座標における空間データの密集したコンパイルである。
我々は3次元多目的追跡(MOT)のためのPointNetベースのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-03T05:36:39Z) - RoIFusion: 3D Object Detection from LiDAR and Vision [7.878027048763662]
本稿では,3次元関心領域(RoI)の集合を点雲から対応する画像の2次元ロIに投影することで,新しい融合アルゴリズムを提案する。
提案手法は,KITTI 3Dオブジェクト検出課題ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2020-09-09T20:23:27Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z) - A Bayesian Filter for Multi-view 3D Multi-object Tracking with Occlusion
Handling [2.824395407508717]
提案アルゴリズムは、カメラ全体の検出総数において線形複雑である。
3次元世界フレームで動作し、オブジェクトの3次元軌道推定を提供する。
提案アルゴリズムは最新のWILDTRACKSデータセットで評価され,非常に混み合った場面で機能することが実証された。
論文 参考訳(メタデータ) (2020-01-13T09:34:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。