Fugu-MT 論文翻訳(概要): Real Evaluations Tractability using Continuous Goal-Directed Actions in Smart City Applications

論文の概要: Real Evaluations Tractability using Continuous Goal-Directed Actions in Smart City Applications

arxiv url: http://arxiv.org/abs/2402.00678v1
Date: Thu, 1 Feb 2024 15:38:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-02 14:47:39.468373
Title: Real Evaluations Tractability using Continuous Goal-Directed Actions in Smart City Applications
Title（参考訳）: スマートシティ・アプリケーションにおける連続目標指向型行動を用いた実態評価
Authors: Raul Fernandez-Fernandez, Juan G. Victores, David Estevez, and Carlos Balaguer
Abstract要約: 継続的目標指向アクション(CGDA)は、環境から抽出できるあらゆる機能の変更としてアクションをエンコードする。現在の戦略では、シミュレーションで評価を行い、最終的な関節軌道を実際のロボットに転送する。 EAを用いた評価を減らすための2つの異なるアプローチが提案され、比較された。
参考スコア（独自算出の注目度）: 3.1158660854608824
License: http://creativecommons.org/licenses/by/4.0/
Abstract: One of the most important challenges of Smart City Applications is to adapt the system to interact with non-expert users. Robot imitation frameworks aim to simplify and reduce times of robot programming by allowing users to program directly through demonstrations. In classical frameworks, actions are modeled using joint or Cartesian space trajectories. Other features, such as visual ones, are not always well represented with these pure geometrical approaches. Continuous Goal-Directed Actions (CGDA) is an alternative to these methods, as it encodes actions as changes of any feature that can be extracted from the environment. As a consequence of this, the robot joint trajectories for execution must be fully computed to comply with this feature-agnostic encoding. This is achieved using Evolutionary Algorithms (EA), which usually requires too many evaluations to perform this evolution step in the actual robot. Current strategies involve performing evaluations in a simulation, transferring the final joint trajectory to the actual robot. Smart City applications involve working in highly dynamic and complex environments, where having a precise model is not always achievable. Our goal is to study the tractability of performing these evaluations directly in a real-world scenario. Two different approaches to reduce the number of evaluations using EA, are proposed and compared. In the first approach, Particle Swarm Optimization (PSO)-based methods have been studied and compared within CGDA: naive PSO, Fitness Inheritance PSO (FI-PSO), and Adaptive Fuzzy Fitness Granulation with PSO (AFFG-PSO). The second approach studied the introduction of geometrical and velocity constraints within CGDA. The effects of both approaches were analyzed and compared in the wax and paint actions, two CGDA commonly studied use cases. Results from this paper depict an important reduction in the number of evaluations.
Abstract（参考訳）: Smart City Applicationsの最も重要な課題の1つは、エキスパートでないユーザとの対話にシステムを適応させることである。ロボット模倣フレームワークは、ユーザがデモを通じて直接プログラムできるようにすることで、ロボットプログラミングの時間を簡素化し、削減することを目的としている。古典的なフレームワークでは、アクションはジョイントあるいはデカルト空間の軌跡を使ってモデル化される。視覚的特徴など他の特徴は、必ずしもこれらの純粋な幾何学的アプローチでよく表されるわけではない。 continuous goal-directed actions(cgda)は、環境から抽出可能な任意の機能の変更としてアクションをエンコードするため、これらのメソッドの代替手段である。この結果、ロボットの関節軌道は、この特徴に依存しない符号化に従うために完全に計算されなければならない。これは、通常、実際のロボットでこの進化ステップを実行するために、あまりにも多くの評価を必要とする進化的アルゴリズム(ea)を使用して達成される。現在の戦略はシミュレーションで評価を行い、最終ジョイント軌道を実際のロボットに転送することである。スマートシティアプリケーションは、必ずしも正確なモデルが達成可能であるとは限らない、非常にダイナミックで複雑な環境で作業する。我々のゴールは、現実世界のシナリオでこれらの評価を直接実行する際のトラクタビリティの研究である。 eaを用いた評価を減らすための2つの異なるアプローチを提案し比較した。第1のアプローチでは、粒子群最適化(pso)に基づく手法がcgda内で研究され、比較されている:naive pso、fitness inheritance pso(fi-pso)、adaptive fuzzy fitness granulation with pso(affg-pso)である。第2のアプローチはcgdaにおける幾何学的および速度的制約の導入を考察した。両アプローチの効果を解析し,ワックス法と塗料法で比較した。本報告では,評価回数の大幅な削減について述べる。

関連論文リスト

Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文参考訳（メタデータ） (2026-01-13T23:36:30Z)
Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。 ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文参考訳（メタデータ） (2025-10-11T18:11:09Z)
Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文参考訳（メタデータ） (2025-03-13T17:48:35Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。 BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文参考訳（メタデータ） (2024-08-30T15:39:34Z)
Planning with Adaptive World Models for Autonomous Driving [50.4439896514353]
マルチエージェントインタラクションをキャプチャする実世界のモーションプランニングベンチマークであるnuPlanを提案する。我々は、グラフ畳み込みニューラルネットワーク(GCNN)であるBehaviorNetを用いて、このようなユニークな振る舞いをモデル化することを学ぶ。また、モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverについても紹介する。
論文参考訳（メタデータ） (2024-06-15T18:53:45Z)
REBEL: A Regularization-Based Solution for Reward Overoptimization in Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数とユーザの意図、価値観、社会的規範の相違は、現実世界で破滅的なものになる可能性がある。人間の嗜好から報酬関数を学習することで、このミスアライメント作業を軽減するための現在の方法。本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文参考訳（メタデータ） (2023-12-22T04:56:37Z)
Real-time Trajectory-based Social Group Detection [22.86110112028644]
本稿では,ソーシャルグループ検出のためのシンプルで効率的なフレームワークを提案する。本稿では,行動軌跡がソーシャルグルーピングに与える影響を考察し,新しい,信頼性の高い,高速なデータ駆動手法を用いる。一般的なJRDBActデータセットに対する実験では,2%から11%の相対的な改善により,顕著な性能向上が見られた。
論文参考訳（メタデータ） (2023-04-12T08:01:43Z)
Re-Evaluating LiDAR Scene Flow for Autonomous Driving [80.37947791534985]
自己教師型LiDARシーンフローの一般的なベンチマークは、動的動き、非現実的な対応、非現実的なサンプリングパターンの非現実的な速度を持つ。実世界のデータセットのスイート上で,トップメソッドのスイートを評価する。学習に重点を置いているにもかかわらず、ほとんどのパフォーマンス向上は前処理と後処理のステップによって引き起こされる。
論文参考訳（メタデータ） (2023-04-04T22:45:50Z)
Obstacle Avoidance for Robotic Manipulator in Joint Space via Improved Proximal Policy Optimization [6.067589886362815]
本稿では,6-DoFマニピュレータのタスク空間から関節空間にマップするために,改良されたPPOアルゴリズムを用いて深層ニューラルネットワークを訓練する。実ロボットでそのようなタスクを訓練するのは時間を要するので、モデルを訓練するためのシミュレーション環境を開発する。実験結果から,ロボットは非構造環境下で1つの目標をトラッキングしたり,複数の目標に到達することができた。
論文参考訳（メタデータ） (2022-10-03T10:21:57Z)
Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and Stability [67.8426046908398]
汎用性と安定性は,実世界における強化学習(RL)エージェントの運用において重要な2つの目的である。本稿では,アクター・クリティック・ロス関数の自動設計法であるMetaPGを提案する。
論文参考訳（メタデータ） (2022-04-08T20:46:16Z)
Benchmarking Deep Reinforcement Learning Algorithms for Vision-based Robotics [11.225021326001778]
本稿では,2つの視覚に基づくロボット工学問題の解法として,最先端の強化学習アルゴリズムのベンチマーク研究を行う。これらのアルゴリズムの性能は、PyBulletの2つのシミュレーション環境であるKukaDiverseObjectEnvとRacecarZEDGymEnvと比較される。
論文参考訳（メタデータ） (2022-01-11T22:45:25Z)
Off Environment Evaluation Using Convex Risk Minimization [0.0]
本稿では,シミュレータと対象領域間のモデルミスマッチを推定する凸リスク最小化アルゴリズムを提案する。対象領域におけるRLエージェントの性能を評価するために,シミュレータとともにこの推定器を使用できることを示す。
論文参考訳（メタデータ） (2021-12-21T21:31:54Z)
Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文参考訳（メタデータ） (2021-11-15T18:50:04Z)
Robotic Grasp Manipulation Using Evolutionary Computing and Deep Reinforcement Learning [0.0]
人間は、何年にもわたって学習しているので、物体をつかむために操作する方法をすぐに知っています。本稿では,課題を位置学習と向き学習の両方に分解することで,学習に基づくポーズ推定を開発することの課題を取り上げている。提案したアーキテクチャとアルゴリズムに基づいて、ロボットは通常の形状の剛体物体をすべて把握することができる。
論文参考訳（メタデータ） (2020-01-15T17:23:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。