論文の概要: Cross-Modal Analysis of Human Detection for Robotics: An Industrial Case
Study
- arxiv url: http://arxiv.org/abs/2108.01495v1
- Date: Tue, 3 Aug 2021 13:33:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 13:53:24.442228
- Title: Cross-Modal Analysis of Human Detection for Robotics: An Industrial Case
Study
- Title(参考訳): ロボティクスにおける人間検出のクロスモーダル解析--産業ケーススタディ
- Authors: Timm Linder, Narunas Vaskevicius, Robert Schirmer, Kai O. Arras
- Abstract要約: ロボット工学で典型的に使用されるセンサとアルゴリズムの組み合わせの系統的相互モーダル分析を行う。
2Dレンジデータ,3Dライダーデータ,RGB-Dデータに対する最先端人検知器の性能の比較を行った。
我々は、強力な画像ベースRGB-D検出器を拡張し、弱い3次元境界ボックスラベルの形でライダー検出器の相互監視を行う。
- 参考スコア(独自算出の注目度): 7.844709223688293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in sensing and learning algorithms have led to increasingly mature
solutions for human detection by robots, particularly in selected use-cases
such as pedestrian detection for self-driving cars or close-range person
detection in consumer settings. Despite this progress, the simple question
"which sensor-algorithm combination is best suited for a person detection task
at hand?" remains hard to answer. In this paper, we tackle this issue by
conducting a systematic cross-modal analysis of sensor-algorithm combinations
typically used in robotics. We compare the performance of state-of-the-art
person detectors for 2D range data, 3D lidar, and RGB-D data as well as
selected combinations thereof in a challenging industrial use-case.
We further address the related problems of data scarcity in the industrial
target domain, and that recent research on human detection in 3D point clouds
has mostly focused on autonomous driving scenarios. To leverage these
methodological advances for robotics applications, we utilize a simple, yet
effective multi-sensor transfer learning strategy by extending a strong
image-based RGB-D detector to provide cross-modal supervision for lidar
detectors in the form of weak 3D bounding box labels.
Our results show a large variance among the different approaches in terms of
detection performance, generalization, frame rates and computational
requirements. As our use-case contains difficulties representative for a wide
range of service robot applications, we believe that these results point to
relevant open challenges for further research and provide valuable support to
practitioners for the design of their robot system.
- Abstract(参考訳): センサーと学習アルゴリズムの進歩は、特に自動運転車の歩行者検出や消費者設定での近距離人検出など、ロボットによる人間の検出に対するソリューションの成熟に繋がった。
この進歩にもかかわらず、単純な質問は「人検出タスクに最適なセンサーとアルゴリズムの組み合わせはどれか?
答えるのは難しい
本稿では,ロボット工学で一般的に使用されるセンサとアルゴリズムの組み合わせの系統的相互モーダル分析を行うことにより,この問題に対処する。
本研究では,2Dレンジデータ,3Dライダー,RGB-Dデータに対する最先端の人体検知器の性能と,その選択した組み合わせを比較した。
産業目標領域におけるデータ不足の関連問題をさらに解決し、3Dポイントクラウドにおける人間の検出に関する最近の研究は、主に自動運転シナリオに焦点を当てている。
これらの手法をロボット工学への応用に活用するために,強力な画像ベースRGB-D検出器を拡張して,弱い3次元境界ボックスラベルの形でライダー検出器の相互監視を行う,シンプルかつ効果的なマルチセンサ転送学習戦略を利用する。
その結果, 検出性能, 一般化, フレームレート, 計算要求の点で, 異なるアプローチの差異が大きいことがわかった。
当社のユースケースには、幅広いサービスロボットアプリケーションの代表的課題が含まれているため、これらの結果は、さらなる研究のための関連するオープンな課題を示し、ロボットシステムの設計を実践者に価値ある支援を提供すると信じています。
関連論文リスト
- Tiny Robotics Dataset and Benchmark for Continual Object Detection [6.4036245876073234]
本研究は,小型ロボットプラットフォームにおける物体検出システムの連続学習能力を評価するための新しいベンチマークを導入する。
i)TiROD(Tiny Robotics Object Detection)は、小さな移動ロボットを用いて収集された包括的なデータセットで、さまざまなドメインやクラスにわたるオブジェクト検出の適応性をテストするように設計されている。
論文 参考訳(メタデータ) (2024-09-24T16:21:27Z) - Multimodal Anomaly Detection based on Deep Auto-Encoder for Object Slip
Perception of Mobile Manipulation Robots [22.63980025871784]
提案フレームワークは,RGBや深度カメラ,マイク,力トルクセンサなど,さまざまなロボットセンサから収集した異種データストリームを統合する。
統合されたデータは、ディープオートエンコーダを訓練して、通常の状態を示す多感覚データの潜在表現を構築するために使用される。
次に、トレーニングされたエンコーダの潜伏値と再構成された入力データの潜伏値との差によって測定された誤差スコアによって異常を識別することができる。
論文 参考訳(メタデータ) (2024-03-06T09:15:53Z) - LS-VOS: Identifying Outliers in 3D Object Detections Using Latent Space
Virtual Outlier Synthesis [10.920640666237833]
LiDARベースの3Dオブジェクト検出器は、自動運転アプリケーションにおいて前例のないスピードと精度を達成した。
それらはしばしば、信頼度の高い予測や、実際のオブジェクトが存在しないリターン検出に偏っている。
LS-VOSは,3次元物体検出における外れ値の同定を行うフレームワークである。
論文 参考訳(メタデータ) (2023-10-02T07:44:26Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Addressing Data Scarcity in Multimodal User State Recognition by
Combining Semi-Supervised and Supervised Learning [1.1688030627514532]
本稿では,人間とロボットの相互作用環境における解離・解離状態を検出するためのマルチモーダル機械学習手法を提案する。
我々は,少ないラベル付きデータと大きなラベル付きデータセットを用いて,デア/アグリメント検出のための平均F1スコア81.1%を達成する。
論文 参考訳(メタデータ) (2022-02-08T10:41:41Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Domain and Modality Gaps for LiDAR-based Person Detection on Mobile
Robots [91.01747068273666]
本稿では,移動ロボットのシナリオに着目した既存のLiDAR人物検出装置について検討する。
実験は3Dと2D LiDARのセンサー間のモダリティのギャップだけでなく、運転と移動ロボットのシナリオ間の領域ギャップを回避している。
その結果、LiDARに基づく人物検出の実践的な洞察を与え、関連する移動ロボットの設計と応用に関する情報決定を容易にする。
論文 参考訳(メタデータ) (2021-06-21T16:35:49Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Task-relevant Representation Learning for Networked Robotic Perception [74.0215744125845]
本稿では,事前学習されたロボット知覚モデルの最終的な目的と協調して設計された感覚データのタスク関連表現を学習するアルゴリズムを提案する。
本アルゴリズムは,ロボットの知覚データを競合する手法の最大11倍まで積極的に圧縮する。
論文 参考訳(メタデータ) (2020-11-06T07:39:08Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。