論文の概要: Analysis of Social Robotic Navigation approaches: CNN Encoder and
Incremental Learning as an alternative to Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2008.07965v2
- Date: Sat, 5 Sep 2020 15:11:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 21:02:34.865736
- Title: Analysis of Social Robotic Navigation approaches: CNN Encoder and
Incremental Learning as an alternative to Deep Reinforcement Learning
- Title(参考訳): CNNエンコーダとインクリメンタルラーニング : 深層強化学習の代替として
- Authors: Janderson Ferreira (1), Agostinho A. F. J\'unior (1), Let\'icia Castro
(1), Yves M. Galv\~ao (1), Pablo Barros (2), Bruno J. T. Fernandes (1) ((1)
Universidade de Pernambuco - Escola Polit\'ecnica de Pernambuco, (2)
Cognitive Architecture for Collaborative Technologies Unit - Istituto
Italiano di Tecnologia)
- Abstract要約: 学習ループに人間を持つことは、最先端の機械学習アルゴリズムと互換性がない。
本研究では,ソーシャルナビゲーションタスクのための適応畳み込みエンコーダに関する以前の研究を分析し,この問題と解決の可能性について論じる。
- 参考スコア(独自算出の注目度): 1.244705780038575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dealing with social tasks in robotic scenarios is difficult, as having humans
in the learning loop is incompatible with most of the state-of-the-art machine
learning algorithms. This is the case when exploring Incremental learning
models, in particular the ones involving reinforcement learning. In this work,
we discuss this problem and possible solutions by analysing a previous study on
adaptive convolutional encoders for a social navigation task.
- Abstract(参考訳): ロボットシナリオにおける社会的タスクへの対処は、人間の学習ループが最先端の機械学習アルゴリズムのほとんどと互換性がないため、難しい。
これは、インクリメンタル学習モデル、特に強化学習を伴うモデルを検討する場合です。
本研究では,ソーシャルナビゲーションタスクのための適応畳み込みエンコーダに関する以前の研究を分析し,この問題と解決の可能性について論じる。
関連論文リスト
- Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文 参考訳(メタデータ) (2024-08-29T20:22:22Z) - Online Context Learning for Socially-compliant Navigation [49.609656402450746]
本文では,ロボットが新たな社会環境に適応できるようにするための,オンラインコンテキスト学習手法を紹介する。
コミュニティワイドシミュレータを用いた実験により,本手法は最先端のシミュレータよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-06-17T12:59:13Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - A Study on Learning Social Robot Navigation with Multimodal Perception [6.052803245103173]
本稿では,大規模実世界のデータセットを用いたマルチモーダル認識を用いた社会ロボットナビゲーションの学習について述べる。
我々は,一助学習と多モーダル学習のアプローチを,異なる社会シナリオにおける古典的なナビゲーション手法のセットと比較する。
その結果、マルチモーダル学習は、データセットと人的学習の両方において、一助学習よりも明らかな優位性を持つことが示された。
論文 参考訳(メタデータ) (2023-09-22T01:47:47Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Fortuitous Forgetting in Connectionist Networks [20.206607130719696]
我々は,ニューラルネットワークの学習軌跡を形成するための強力なパラダイムとして,"forget-and-relearn"を紹介した。
forget-and-relearnフレームワークは、画像分類と言語出現文学において、多くの既存の反復的トレーニングアルゴリズムを統合する。
我々は、この理解を活用して、よりターゲットを絞った忘れ操作を設計することで、既存のアルゴリズムを改善する。
論文 参考訳(メタデータ) (2022-02-01T00:15:58Z) - Improving exploration in policy gradient search: Application to symbolic
optimization [6.344988093245026]
多くの機械学習戦略は、ニューラルネットワークを利用して数学記号の大きな空間を探索する。
従来の進化的アプローチとは対照的に、検索のコアでニューラルネットワークを使用することで、より高いレベルのシンボルパターンを学習することができる。
これらの手法は, 性能の向上, サンプル効率の向上, シンボル回帰の課題に対する解の複雑さの低減を図っている。
論文 参考訳(メタデータ) (2021-07-19T21:11:07Z) - XAI-N: Sensor-based Robot Navigation using Expert Policies and Decision
Trees [55.9643422180256]
本稿では,ロボットの密集した動的環境における衝突のない軌道を計算するためのセンサベース学習ナビゲーションアルゴリズムを提案する。
我々のアプローチは、sim2realパラダイムを用いて訓練された深層強化学習に基づくエキスパートポリシーを使用する。
シミュレーション環境でのアルゴリズムの利点を強調し、移動中の歩行者の間でClearpath Jackalロボットをナビゲートする。
論文 参考訳(メタデータ) (2021-04-22T01:33:10Z) - Reward Shaping with Subgoals for Social Navigation [7.6146285961466]
ソーシャルナビゲーションは、マシンインテリジェンスの成長と共に注目を集めている。
強化学習は、低い計算コストで予測フェーズのアクションを選択することができる。
学習を加速するサブゴールを用いた報酬形成手法を提案する。
論文 参考訳(メタデータ) (2021-04-13T13:52:58Z) - Robot Navigation in a Crowd by Integrating Deep Reinforcement Learning
and Online Planning [8.211771115758381]
これは、群衆の中で時間効率と衝突のない道を移動するモバイルロボットにとって、まだオープンで挑戦的な問題です。
深層強化学習はこの問題に対する有望な解決策である。
グラフに基づく深部強化学習手法SG-DQNを提案する。
私たちのモデルは、ロボットが群衆をよりよく理解し、群衆ナビゲーションタスクで0.99以上の高い成功率を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-02-26T02:17:13Z) - Hierarchical Affordance Discovery using Intrinsic Motivation [69.9674326582747]
本研究では,移動ロボットの価格学習を支援するために,本質的なモチベーションを用いたアルゴリズムを提案する。
このアルゴリズムは、事前にプログラムされたアクションなしで、相互に関連のある価格を自律的に発見し、学習し、適応することができる。
一度学習すると、これらの余裕はアルゴリズムによって様々な困難を伴うタスクを実行するために一連のアクションを計画するために使われる。
論文 参考訳(メタデータ) (2020-09-23T07:18:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。