論文の概要: A comparative evaluation of machine learning methods for robot
navigation through human crowds
- arxiv url: http://arxiv.org/abs/2012.08822v1
- Date: Wed, 16 Dec 2020 09:40:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 08:42:52.789860
- Title: A comparative evaluation of machine learning methods for robot
navigation through human crowds
- Title(参考訳): 人群を通したロボットナビゲーションのための機械学習手法の比較評価
- Authors: Anastasia Gaydashenko, Daniel Kudenko, Aleksei Shpilman
- Abstract要約: ニューヨークのグランドセントラル駅で撮影した監視ビデオから収集された群集移動データセットのパスファインディング/予測および強化学習アプローチを比較します。
その結果,最先端の動作予測技術を用いたパスフィンディングに対して,最先端の強化学習アプローチが強い優位性を示した。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robot navigation through crowds poses a difficult challenge to AI systems,
since the methods should result in fast and efficient movement but at the same
time are not allowed to compromise safety. Most approaches to date were focused
on the combination of pathfinding algorithms with machine learning for
pedestrian walking prediction. More recently, reinforcement learning techniques
have been proposed in the research literature. In this paper, we perform a
comparative evaluation of pathfinding/prediction and reinforcement learning
approaches on a crowd movement dataset collected from surveillance videos taken
at Grand Central Station in New York. The results demonstrate the strong
superiority of state-of-the-art reinforcement learning approaches over
pathfinding with state-of-the-art behaviour prediction techniques.
- Abstract(参考訳): 群衆を通したロボットナビゲーションは、高速で効率的な動きをもたらすが、同時に安全性を損なうことは許されないため、AIシステムにとって難しい課題である。
これまでのほとんどのアプローチは、歩行者歩行予測のためのパスフィニングアルゴリズムと機械学習の組み合わせに焦点を当てていた。
近年,研究文献に強化学習技術が提案されている。
本稿では,ニューヨークのグランド・セントラル駅で撮影された監視映像から収集した群集運動データを用いて,パスファインディング・予測・強化学習手法の比較評価を行う。
その結果, パスフィンディングに対する最先端の強化学習手法と, 最先端の行動予測手法との強い優位性を示した。
関連論文リスト
- Online Context Learning for Socially-compliant Navigation [49.609656402450746]
本文では,ロボットが新たな社会環境に適応できるようにするための,オンラインコンテキスト学習手法を紹介する。
コミュニティワイドシミュレータを用いた実験により,本手法は最先端のシミュレータよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-06-17T12:59:13Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - Deep Reinforcement Learning for Autonomous Vehicle Intersection
Navigation [0.24578723416255746]
強化学習アルゴリズムは、これらの課題に対処するための有望なアプローチとして登場した。
そこで本研究では,低コスト単一エージェントアプローチを用いて,T断面積を効率よく安全にナビゲートする問題に対処する。
提案手法により,AVはT断面積を効果的にナビゲートし,走行遅延,衝突最小化,総コストの面で従来の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2023-09-30T10:54:02Z) - Machine Learning for Autonomous Vehicle's Trajectory Prediction: A
comprehensive survey, Challenges, and Future Research Directions [3.655021726150368]
AVの文脈における軌道予測に関する200以上の研究について検討した。
本総説では,いくつかの深層学習手法を総合的に評価する。
既存の文献の課題を特定し,潜在的研究の方向性を概説することにより,AV軌道予測領域における知識の進歩に大きく貢献する。
論文 参考訳(メタデータ) (2023-07-12T10:20:19Z) - Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and
Heuristic Rule-based Methods for Object Manipulation [118.27432851053335]
本稿では,SAPIEN ManiSkill Challenge 2021: No Interaction Trackにおいて,以下の2つのトラックを対象としたシステムの概要と比較分析を行った。
No Interactionは、事前に収集された実証軌道からの学習ポリシーのターゲットを追跡する。
このトラックでは,タスクを一連のサブタスクに分解することで,高品質なオブジェクト操作をトリガするHuristic Rule-based Method (HRM) を設計する。
各サブタスクに対して、ロボットアームに適用可能なアクションを予測するために、単純なルールベースの制御戦略が採用されている。
論文 参考訳(メタデータ) (2022-06-13T16:20:42Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - Review of Pedestrian Trajectory Prediction Methods: Comparing Deep
Learning and Knowledge-based Approaches [0.0]
本稿では,歩行者動態のシミュレートに広く用いられている古典的知識ベースモデルとディープラーニングアルゴリズムを比較した。
大規模シミュレーションのためのディープラーニングアルゴリズムの能力と集合力学の記述は、いまだに実証されていない。
論文 参考訳(メタデータ) (2021-11-11T08:35:14Z) - Robot Navigation in a Crowd by Integrating Deep Reinforcement Learning
and Online Planning [8.211771115758381]
これは、群衆の中で時間効率と衝突のない道を移動するモバイルロボットにとって、まだオープンで挑戦的な問題です。
深層強化学習はこの問題に対する有望な解決策である。
グラフに基づく深部強化学習手法SG-DQNを提案する。
私たちのモデルは、ロボットが群衆をよりよく理解し、群衆ナビゲーションタスクで0.99以上の高い成功率を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-02-26T02:17:13Z) - NavRep: Unsupervised Representations for Reinforcement Learning of Robot
Navigation in Dynamic Human Environments [28.530962677406627]
2つのエンドツーエンドと18の教師なし学習ベースのアーキテクチャをトレーニングし、それらと既存のアプローチを未認識のテストケースで比較します。
その結果,教師なし学習手法はエンドツーエンドの手法と競合することがわかった。
このリリースには、他の論文で記述されたトレーニング条件をエミュレートするように設計されたopenai-gym互換環境も含まれている。
論文 参考訳(メタデータ) (2020-12-08T12:51:14Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。