論文の概要: Real Evaluations Tractability using Continuous Goal-Directed Actions in
Smart City Applications
- arxiv url: http://arxiv.org/abs/2402.00678v1
- Date: Thu, 1 Feb 2024 15:38:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-02 14:47:39.468373
- Title: Real Evaluations Tractability using Continuous Goal-Directed Actions in
Smart City Applications
- Title(参考訳): スマートシティ・アプリケーションにおける連続目標指向型行動を用いた実態評価
- Authors: Raul Fernandez-Fernandez, Juan G. Victores, David Estevez, and Carlos
Balaguer
- Abstract要約: 継続的目標指向アクション(CGDA)は、環境から抽出できるあらゆる機能の変更としてアクションをエンコードする。
現在の戦略では、シミュレーションで評価を行い、最終的な関節軌道を実際のロボットに転送する。
EAを用いた評価を減らすための2つの異なるアプローチが提案され、比較された。
- 参考スコア(独自算出の注目度): 3.1158660854608824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the most important challenges of Smart City Applications is to adapt
the system to interact with non-expert users. Robot imitation frameworks aim to
simplify and reduce times of robot programming by allowing users to program
directly through demonstrations. In classical frameworks, actions are modeled
using joint or Cartesian space trajectories. Other features, such as visual
ones, are not always well represented with these pure geometrical approaches.
Continuous Goal-Directed Actions (CGDA) is an alternative to these methods, as
it encodes actions as changes of any feature that can be extracted from the
environment. As a consequence of this, the robot joint trajectories for
execution must be fully computed to comply with this feature-agnostic encoding.
This is achieved using Evolutionary Algorithms (EA), which usually requires too
many evaluations to perform this evolution step in the actual robot. Current
strategies involve performing evaluations in a simulation, transferring the
final joint trajectory to the actual robot. Smart City applications involve
working in highly dynamic and complex environments, where having a precise
model is not always achievable. Our goal is to study the tractability of
performing these evaluations directly in a real-world scenario. Two different
approaches to reduce the number of evaluations using EA, are proposed and
compared. In the first approach, Particle Swarm Optimization (PSO)-based
methods have been studied and compared within CGDA: naive PSO, Fitness
Inheritance PSO (FI-PSO), and Adaptive Fuzzy Fitness Granulation with PSO
(AFFG-PSO). The second approach studied the introduction of geometrical and
velocity constraints within CGDA. The effects of both approaches were analyzed
and compared in the wax and paint actions, two CGDA commonly studied use cases.
Results from this paper depict an important reduction in the number of
evaluations.
- Abstract(参考訳): Smart City Applicationsの最も重要な課題の1つは、エキスパートでないユーザとの対話にシステムを適応させることである。
ロボット模倣フレームワークは、ユーザがデモを通じて直接プログラムできるようにすることで、ロボットプログラミングの時間を簡素化し、削減することを目的としている。
古典的なフレームワークでは、アクションはジョイントあるいはデカルト空間の軌跡を使ってモデル化される。
視覚的特徴など他の特徴は、必ずしもこれらの純粋な幾何学的アプローチでよく表されるわけではない。
continuous goal-directed actions(cgda)は、環境から抽出可能な任意の機能の変更としてアクションをエンコードするため、これらのメソッドの代替手段である。
この結果、ロボットの関節軌道は、この特徴に依存しない符号化に従うために完全に計算されなければならない。
これは、通常、実際のロボットでこの進化ステップを実行するために、あまりにも多くの評価を必要とする進化的アルゴリズム(ea)を使用して達成される。
現在の戦略はシミュレーションで評価を行い、最終ジョイント軌道を実際のロボットに転送することである。
スマートシティアプリケーションは、必ずしも正確なモデルが達成可能であるとは限らない、非常にダイナミックで複雑な環境で作業する。
我々のゴールは、現実世界のシナリオでこれらの評価を直接実行する際のトラクタビリティの研究である。
eaを用いた評価を減らすための2つの異なるアプローチを提案し比較した。
第1のアプローチでは、粒子群最適化(pso)に基づく手法がcgda内で研究され、比較されている:naive pso、fitness inheritance pso(fi-pso)、adaptive fuzzy fitness granulation with pso(affg-pso)である。
第2のアプローチはcgdaにおける幾何学的および速度的制約の導入を考察した。
両アプローチの効果を解析し,ワックス法と塗料法で比較した。
本報告では,評価回数の大幅な削減について述べる。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。
BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文 参考訳(メタデータ) (2024-08-30T15:39:34Z) - REBEL: A Regularization-Based Solution for Reward Overoptimization in Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数とユーザの意図、価値観、社会的規範の相違は、現実世界で破滅的なものになる可能性がある。
人間の嗜好から報酬関数を学習することで、このミスアライメント作業を軽減するための現在の方法。
本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文 参考訳(メタデータ) (2023-12-22T04:56:37Z) - Real-time Trajectory-based Social Group Detection [22.86110112028644]
本稿では,ソーシャルグループ検出のためのシンプルで効率的なフレームワークを提案する。
本稿では,行動軌跡がソーシャルグルーピングに与える影響を考察し,新しい,信頼性の高い,高速なデータ駆動手法を用いる。
一般的なJRDBActデータセットに対する実験では,2%から11%の相対的な改善により,顕著な性能向上が見られた。
論文 参考訳(メタデータ) (2023-04-12T08:01:43Z) - Re-Evaluating LiDAR Scene Flow for Autonomous Driving [80.37947791534985]
自己教師型LiDARシーンフローの一般的なベンチマークは、動的動き、非現実的な対応、非現実的なサンプリングパターンの非現実的な速度を持つ。
実世界のデータセットのスイート上で,トップメソッドのスイートを評価する。
学習に重点を置いているにもかかわらず、ほとんどのパフォーマンス向上は前処理と後処理のステップによって引き起こされる。
論文 参考訳(メタデータ) (2023-04-04T22:45:50Z) - Obstacle Avoidance for Robotic Manipulator in Joint Space via Improved
Proximal Policy Optimization [6.067589886362815]
本稿では,6-DoFマニピュレータのタスク空間から関節空間にマップするために,改良されたPPOアルゴリズムを用いて深層ニューラルネットワークを訓練する。
実ロボットでそのようなタスクを訓練するのは時間を要するので、モデルを訓練するためのシミュレーション環境を開発する。
実験結果から,ロボットは非構造環境下で1つの目標をトラッキングしたり,複数の目標に到達することができた。
論文 参考訳(メタデータ) (2022-10-03T10:21:57Z) - Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and
Stability [67.8426046908398]
汎用性と安定性は,実世界における強化学習(RL)エージェントの運用において重要な2つの目的である。
本稿では,アクター・クリティック・ロス関数の自動設計法であるMetaPGを提案する。
論文 参考訳(メタデータ) (2022-04-08T20:46:16Z) - Benchmarking Deep Reinforcement Learning Algorithms for Vision-based
Robotics [11.225021326001778]
本稿では,2つの視覚に基づくロボット工学問題の解法として,最先端の強化学習アルゴリズムのベンチマーク研究を行う。
これらのアルゴリズムの性能は、PyBulletの2つのシミュレーション環境であるKukaDiverseObjectEnvとRacecarZEDGymEnvと比較される。
論文 参考訳(メタデータ) (2022-01-11T22:45:25Z) - Off Environment Evaluation Using Convex Risk Minimization [0.0]
本稿では,シミュレータと対象領域間のモデルミスマッチを推定する凸リスク最小化アルゴリズムを提案する。
対象領域におけるRLエージェントの性能を評価するために,シミュレータとともにこの推定器を使用できることを示す。
論文 参考訳(メタデータ) (2021-12-21T21:31:54Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Robotic Grasp Manipulation Using Evolutionary Computing and Deep
Reinforcement Learning [0.0]
人間は、何年にもわたって学習しているので、物体をつかむために操作する方法をすぐに知っています。
本稿では,課題を位置学習と向き学習の両方に分解することで,学習に基づくポーズ推定を開発することの課題を取り上げている。
提案したアーキテクチャとアルゴリズムに基づいて、ロボットは通常の形状の剛体物体をすべて把握することができる。
論文 参考訳(メタデータ) (2020-01-15T17:23:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。