論文の概要: Vision-based Perception System for Automated Delivery Robot-Pedestrians Interactions
- arxiv url: http://arxiv.org/abs/2508.03541v1
- Date: Tue, 05 Aug 2025 15:10:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:56.036789
- Title: Vision-based Perception System for Automated Delivery Robot-Pedestrians Interactions
- Title(参考訳): 自動配送ロボット-歩行者インタラクションのための視覚に基づく知覚システム
- Authors: Ergi Tushe, Bilal Farooq,
- Abstract要約: 単一視覚センサを用いたマルチペデストリアン検出・追跡,ポーズ推定,単眼深度知覚のための完全なパイプラインを開発した。
結果は、最大10%のアイデンティティ保存の増加を含む測定可能な改善を示している。
このシステムは、より社会的に認識され、包括的なロボット行動を支援する、脆弱な歩行者グループを特定する。
- 参考スコア(独自算出の注目度): 4.378407481656902
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The integration of Automated Delivery Robots (ADRs) into pedestrian-heavy urban spaces introduces unique challenges in terms of safe, efficient, and socially acceptable navigation. We develop the complete pipeline for a single vision sensor based multi-pedestrian detection and tracking, pose estimation, and monocular depth perception. Leveraging the real-world MOT17 dataset sequences, this study demonstrates how integrating human-pose estimation and depth cues enhances pedestrian trajectory prediction and identity maintenance, even under occlusions and dense crowds. Results show measurable improvements, including up to a 10% increase in identity preservation (IDF1), a 7% improvement in multiobject tracking accuracy (MOTA), and consistently high detection precision exceeding 85%, even in challenging scenarios. Notably, the system identifies vulnerable pedestrian groups supporting more socially aware and inclusive robot behaviour.
- Abstract(参考訳): ADR(Automated Delivery Robots)の歩行者の多い都市空間への統合は、安全で効率的で社会的に許容できるナビゲーションというユニークな課題をもたらす。
単一視覚センサを用いたマルチペデストリアン検出・追跡,ポーズ推定,単眼深度知覚のための完全なパイプラインを開発した。
実世界のMOT17データセットシーケンスを活用することで、人為的推定と深度キューの統合が、オクルージョンや密集した群衆の下でも、歩行者の軌道予測とアイデンティティ維持をいかに促進するかを実証する。
その結果、IDF1の10%増加、マルチオブジェクト追跡精度(MOTA)の7%向上、難解なシナリオであっても、継続的に高い検出精度が85%以上となるなど、測定可能な改善が見られた。
このシステムは、より社会的に認識され、包括的なロボット行動を支援する、脆弱な歩行者グループを特定する。
関連論文リスト
- Privacy-Preserving Driver Drowsiness Detection with Spatial Self-Attention and Federated Learning [10.067641629547014]
ドライバーの眠気は道路事故の主な原因の1つであり、交通事故による死亡事故の主要な原因と認識されている。
本研究では,不均質データと分散データとを効果的に扱えるよう設計した,眠気検出のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-01T03:12:01Z) - YOLO-APD: Enhancing YOLOv8 for Robust Pedestrian Detection on Complex Road Geometries [0.0]
本稿では,この課題に特化してYOLOv8フレームワークを改良した新しいディープラーニングアーキテクチャであるYOLO-APDを紹介する。
YOLO-APDは最先端の精度を達成し、77.7% mAP@0.5:0.95、例外的な歩行者リコールは96%を超えた。
リアルタイム処理能力を100 FPSで維持し、精度と効率のバランスが優れていることを示す。
論文 参考訳(メタデータ) (2025-07-07T18:03:40Z) - Enhancing Traffic Sign Recognition On The Performance Based On Yolov8 [0.0]
この論文では、高度なデータ拡張技術を統合する拡張YOLOv8ベースの検出システムを提案する。
GTSRB、TT100K、GTSDBなどのデータセットで実施された実験では、検出精度、悪条件下での堅牢性、エッジデバイス上でのリアルタイム推論が著しく改善された。
論文 参考訳(メタデータ) (2025-04-02T07:28:05Z) - A Cross-Scene Benchmark for Open-World Drone Active Tracking [54.235808061746525]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATと呼ばれるオープンワールドドローンアクティブトラッキングのためのクロスシーンクロスドメインベンチマークを提案する。
また、R-VATと呼ばれる強化学習に基づくドローン追跡手法を提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Traffic and Safety Rule Compliance of Humans in Diverse Driving Situations [48.924085579865334]
安全な運転プラクティスを再現する自律システムを開発するためには、人間のデータを分析することが不可欠だ。
本稿では,複数の軌道予測データセットにおける交通・安全規則の適合性の比較評価を行う。
論文 参考訳(メタデータ) (2024-11-04T09:21:00Z) - RoboSense: Large-scale Dataset and Benchmark for Egocentric Robot Perception and Navigation in Crowded and Unstructured Environments [62.5830455357187]
我々は3種類のセンサー(Camera, LiDAR, Fisheye)をベースとした自我中心型マルチセンサデータ収集プラットフォームを構築した。
大規模なマルチモーダルデータセットであるRoboSenseは、エゴセントリックなロボット知覚を促進するために構築されている。
論文 参考訳(メタデータ) (2024-08-28T03:17:40Z) - Real-Time Detection and Analysis of Vehicles and Pedestrians using Deep Learning [0.0]
現在の交通監視システムは、小さな物体や歩行者をリアルタイムで効果的に認識する上で大きな困難に直面している。
本研究は、車や人の正確なリアルタイム認識のための複雑な視覚入力を処理できる高度なディープラーニングフレームワークの作成と検証に重点を置いている。
YOLOv8 大型モデルは、特に歩行者認識において最も効果的で、精度と堅牢性が高いことが判明した。
論文 参考訳(メタデータ) (2024-04-11T18:42:14Z) - SHIFT: A Synthetic Driving Dataset for Continuous Multi-Task Domain
Adaptation [152.60469768559878]
ShiFTは、自動運転のための最大規模のマルチタスク合成データセットである。
曇り、雨と霧の強さ、昼の時間、車と歩行者の密度を個別に連続的に変化させる。
私たちのデータセットとベンチマークツールキットはwww.vis.xyz/shift.comで公開されています。
論文 参考訳(メタデータ) (2022-06-16T17:59:52Z) - Multi-Robot Collaborative Perception with Graph Neural Networks [6.383576104583731]
汎用グラフニューラルネットワーク(GNN)を提案する。
提案手法は,単眼深度推定やセマンティックセグメンテーションなどの多視点視覚認識問題に対処できることを示す。
論文 参考訳(メタデータ) (2022-01-05T18:47:07Z) - Benchmarking high-fidelity pedestrian tracking systems for research,
real-time monitoring and crowd control [55.41644538483948]
実生活環境における高忠実な歩行者追跡は,群集動態研究において重要なツールである。
この技術が進歩するにつれて、社会においても益々有用になってきている。
歩行者追跡技術の研究と技術に成功させるためには、正確さの検証とベンチマークが不可欠である。
我々は、プライバシーに配慮した歩行者追跡技術のためのベンチマークスイートをコミュニティのオープンスタンダードに向けて提示し、議論する。
論文 参考訳(メタデータ) (2021-08-26T11:45:26Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。