論文の概要: StrObe: Streaming Object Detection from LiDAR Packets
- arxiv url: http://arxiv.org/abs/2011.06425v2
- Date: Fri, 13 Nov 2020 17:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 07:34:54.821153
- Title: StrObe: Streaming Object Detection from LiDAR Packets
- Title(参考訳): strobe:lidarパケットからのストリーミングオブジェクト検出
- Authors: Davi Frossard, Simon Suo, Sergio Casas, James Tu, Rui Hu, Raquel
Urtasun
- Abstract要約: ローリングシャッターのLiDARはパケットのストリームとして出力され、それぞれ360degのカバレッジのセクターをカバーする。
現代の認識アルゴリズムは、データを処理する前に全スイープが構築されるのを待つ。
本稿では,LiDARパケットを取り込み,全スイープが構築されるのを待たずに検出ストリームを出力することで,レイテンシを最小化する新しいアプローチであるStrObeを提案する。
- 参考スコア(独自算出の注目度): 73.27333924964306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many modern robotics systems employ LiDAR as their main sensing modality due
to its geometrical richness. Rolling shutter LiDARs are particularly common, in
which an array of lasers scans the scene from a rotating base. Points are
emitted as a stream of packets, each covering a sector of the 360{\deg}
coverage. Modern perception algorithms wait for the full sweep to be built
before processing the data, which introduces an additional latency. For typical
10Hz LiDARs this will be 100ms. As a consequence, by the time an output is
produced, it no longer accurately reflects the state of the world. This poses a
challenge, as robotics applications require minimal reaction times, such that
maneuvers can be quickly planned in the event of a safety-critical situation.
In this paper we propose StrObe, a novel approach that minimizes latency by
ingesting LiDAR packets and emitting a stream of detections without waiting for
the full sweep to be built. StrObe reuses computations from previous packets
and iteratively updates a latent spatial representation of the scene, which
acts as a memory, as new evidence comes in, resulting in accurate low-latency
perception. We demonstrate the effectiveness of our approach on a large scale
real-world dataset, showing that StrObe far outperforms the state-of-the-art
when latency is taken into account, and matches the performance in the
traditional setting.
- Abstract(参考訳): 多くの現代のロボティクスシステムは、その幾何学的豊かさのためにLiDARを主要なセンシングモダリティとして採用している。
ローリングシャッターのLiDARは特に一般的で、レーザーのアレイが回転ベースからシーンをスキャンする。
ポイントはパケットのストリームとして出力され、それぞれが360{\deg}カバレッジのセクタをカバーする。
現代の知覚アルゴリズムは、データを処理する前に完全なスイープが構築されるのを待つ。
典型的な10HzのLiDARでは100msとなる。
その結果、出力が生成されるまでに、それはもはや世界の状態を正確に反映しない。
ロボット工学の応用は最小限の反応時間を必要とするため、安全クリティカルな状況において迅速に操作を計画できるため、これは課題となる。
本稿では,LiDARパケットを取り込み,全スイープが構築されるのを待たずに検出ストリームを出力することで,レイテンシを最小化する新しいアプローチであるStrObeを提案する。
StrObeは以前のパケットから計算を再利用し、新たなエビデンスが発生するとシーンの潜在空間表現を反復的に更新し、正確な低遅延知覚をもたらす。
大規模な実世界のデータセット上でのアプローチの有効性を実証し、レイテンシを考慮した場合、StrObeは最先端のデータをはるかに上回り、従来の設定でのパフォーマンスに匹敵することを示す。
関連論文リスト
- Characterization of point-source transient events with a rolling-shutter compressed sensing system [0.0]
ポイントソースの過渡イベント(PSTE)は、イメージングシステムにいくつかの課題をもたらす。
これらの要件を満たす従来のイメージングシステムは、価格、サイズ、重量、消費電力、データ帯域幅の点で費用がかかる。
画像システムのローリングシャッター読み出しに適応した新しい圧縮センシングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-08-29T19:22:37Z) - Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - TimePillars: Temporally-Recurrent 3D LiDAR Object Detection [8.955064958311517]
TimePillarsは時間的にリカレントなオブジェクト検出パイプラインである。
時間にわたってLiDARデータの柱表現を利用する。
基礎的なビルディングブロックがいかに堅牢で効率的な結果を得るのに十分なかを示す。
論文 参考訳(メタデータ) (2023-12-22T10:25:27Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Multi-modal Streaming 3D Object Detection [20.01800869678355]
本稿では,革新的なカメラ-LiDARストリーミング3Dオブジェクト検出フレームワークを提案する。
過去のLiDARスライスの代わりにカメライメージを使用して、ストリーミング知覚のための最新で高密度で広いコンテキストを提供する。
提案手法は, カメラ画像の欠落, 狭いLiDARスライス, 小型カメラとLiDARの誤校正に対する堅牢性を示す。
論文 参考訳(メタデータ) (2022-09-12T00:30:52Z) - Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文 参考訳(メタデータ) (2022-01-13T15:20:45Z) - Rethinking Drone-Based Search and Rescue with Aerial Person Detection [79.76669658740902]
航空ドローンの映像の視覚検査は、現在土地捜索救助(SAR)活動に不可欠な部分である。
本稿では,この空中人物検出(APD)タスクを自動化するための新しいディープラーニングアルゴリズムを提案する。
本稿では,Aerial Inspection RetinaNet (AIR) アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2021-11-17T21:48:31Z) - FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。
提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。
Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文 参考訳(メタデータ) (2021-08-27T03:07:55Z) - Streaming Object Detection for 3-D Point Clouds [29.465873948076766]
LiDARは、多くの既存の知覚システムに通知する顕著な感覚モダリティを提供する。
ポイントクラウドデータに基づく知覚システムのレイテンシは、完全なローテーションスキャンの時間量によって支配される。
我々は、LiDARデータをそのネイティブストリーミング定式化で操作することで、自動運転オブジェクト検出にいくつかの利点があることを示す。
論文 参考訳(メタデータ) (2020-05-04T21:55:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。