論文の概要: EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment
- arxiv url: http://arxiv.org/abs/2503.14329v2
- Date: Wed, 19 Mar 2025 08:55:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 12:00:53.749795
- Title: EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment
- Title(参考訳): EvolvingGrasp: 効率的な選好アライメントによる進化的グラフ生成
- Authors: Yufei Zhu, Yiming Zhong, Zemin Yang, Peishan Cong, Jingyi Yu, Xinge Zhu, Yuexin Ma,
- Abstract要約: EvolvingGraspは、優先アライメントによる把握性能を継続的に向上する進化的グリップ生成法である。
EvolvingGraspは, シミュレーションと実シナリオの両方において, 進化的把握生成, 堅牢で, 物理的に実現可能で, 嗜好に整合した把握を可能にする。
- 参考スコア(独自算出の注目度): 42.41408547627677
- License:
- Abstract: Dexterous robotic hands often struggle to generalize effectively in complex environments due to the limitations of models trained on low-diversity data. However, the real world presents an inherently unbounded range of scenarios, making it impractical to account for every possible variation. A natural solution is to enable robots learning from experience in complex environments, an approach akin to evolution, where systems improve through continuous feedback, learning from both failures and successes, and iterating toward optimal performance. Motivated by this, we propose EvolvingGrasp, an evolutionary grasp generation method that continuously enhances grasping performance through efficient preference alignment. Specifically, we introduce Handpose wise Preference Optimization (HPO), which allows the model to continuously align with preferences from both positive and negative feedback while progressively refining its grasping strategies. To further enhance efficiency and reliability during online adjustments, we incorporate a Physics-aware Consistency Model within HPO, which accelerates inference, reduces the number of timesteps needed for preference finetuning, and ensures physical plausibility throughout the process. Extensive experiments across four benchmark datasets demonstrate state of the art performance of our method in grasp success rate and sampling efficiency. Our results validate that EvolvingGrasp enables evolutionary grasp generation, ensuring robust, physically feasible, and preference-aligned grasping in both simulation and real scenarios.
- Abstract(参考訳): 有害なロボットハンドは、低多様性データで訓練されたモデルの制限のため、複雑な環境で効果的に一般化するのに苦労することが多い。
しかし、現実の世界は本質的に非有界なシナリオを示しており、可能なすべてのバリエーションを考慮することは現実的ではない。
自然な解決策は、ロボットが複雑な環境における経験から学び、進化に似たアプローチで、システムは継続的なフィードバックを通じて改善し、失敗と成功の両方から学習し、最適なパフォーマンスに向かって反復する。
そこで本研究では,効率的な選好アライメントを通じて,把握性能を継続的に向上する進化的グリップ生成法であるEvolvingGraspを提案する。
具体的には、HPO(Handpose wise Preference Optimization)を導入し、モデルが肯定的、否定的の両方からの好みと連続的に一致しつつ、把握戦略を段階的に改善することを可能にする。
オンライン調整における効率性と信頼性をさらに向上するため,HPO内に物理認識整合性モデルを導入し,推論を高速化し,選好微調整に必要な時間ステップ数を削減し,プロセス全体を通して物理的妥当性を確保する。
4つのベンチマークデータセットにわたる大規模な実験は、成功率とサンプリング効率の把握において、我々の手法の最先端性能を示す。
EvolvingGraspは, シミュレーションと実シナリオの両方において, 進化的把握生成, 堅牢で, 物理的に実現可能で, 嗜好に整合した把握を可能にする。
関連論文リスト
- Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
私たちは世界モデルを学ぶための新しいフレームワークを紹介します。
スケーラブルで堅牢なフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - FADAS: Towards Federated Adaptive Asynchronous Optimization [56.09666452175333]
フェデレートラーニング(FL)は、プライバシ保護機械学習のトレーニングパラダイムとして広く採用されている。
本稿では、非同期更新を適応的フェデレーション最適化と証明可能な保証に組み込む新しい手法であるFADASについて紹介する。
提案アルゴリズムの収束率を厳格に確立し,FADASが他の非同期FLベースラインよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2024-07-25T20:02:57Z) - Aligning Optimization Trajectories with Diffusion Models for Constrained
Design Generation [17.164961143132473]
本稿では,拡散モデルのサンプリング軌跡と従来の物理法に基づく最適化軌跡との整合性を示す学習フレームワークを提案する。
提案手法では,高コストプリプロセッシングや外部サロゲートモデル,ラベル付きデータの追加を必要とせずに,実用的で高性能な設計を2段階で生成することができる。
この結果から, TAは分布内構成における最先端の深層生成モデルより優れ, 推論計算コストを半減することがわかった。
論文 参考訳(メタデータ) (2023-05-29T09:16:07Z) - A Data-Driven Evolutionary Transfer Optimization for Expensive Problems
in Dynamic Environments [9.098403098464704]
データ駆動、つまりサロゲート支援、進化的最適化は、高価なブラックボックス最適化問題に対処するための効果的なアプローチとして認識されている。
本稿では,データ駆動型進化的最適化により動的最適化問題を解くための,シンプルだが効果的な伝達学習フレームワークを提案する。
提案手法の有効性を実世界のケーススタディで実証した。
論文 参考訳(メタデータ) (2022-11-05T11:19:50Z) - Accelerated Federated Learning with Decoupled Adaptive Optimization [53.230515878096426]
フェデレートドラーニング(FL)フレームワークは、クライアント上のトレーニングデータのプライバシを維持しながら、共有モデルを協調的に学習することを可能にする。
近年,SGDM,Adam,AdaGradなどの集中型適応最適化手法をフェデレートした設定に一般化するためのイテレーションが多数実施されている。
本研究は、常微分方程式(ODE)のダイナミクスの観点から、FLの新しい適応最適化手法を開発することを目的としている。
論文 参考訳(メタデータ) (2022-07-14T22:46:43Z) - Optimization-Derived Learning with Essential Convergence Analysis of
Training and Hyper-training [52.39882976848064]
固定点反復に基づく一般化クラスノセルスキーマンスキースキーム(GKM)を基本ODLモジュールとして設計する。
GKMスキームでは、最適トレーニングとハイパートレーニング変数を同時に解くために、バイレベルメタ最適化(BMO)アルゴリズムフレームワークを構築している。
論文 参考訳(メタデータ) (2022-06-16T01:50:25Z) - Surrogate-assisted distributed swarm optimisation for computationally
expensive geoscientific models [1.8627798812601288]
並列計算アーキテクチャ上での分散Swarm最適化におけるサロゲートに基づく適合度評価を実装した。
この結果は,ベンチマーク関数とバッドランド景観の進化モデルに対して非常に有望な結果を示す。
この論文の主な貢献は、測地モデルに対する代理に基づく最適化の適用である。
論文 参考訳(メタデータ) (2022-01-18T09:37:14Z) - EOS: a Parallel, Self-Adaptive, Multi-Population Evolutionary Algorithm
for Constrained Global Optimization [68.8204255655161]
EOSは実数値変数の制約付きおよび制約なし問題に対する大域的最適化アルゴリズムである。
これはよく知られた微分進化(DE)アルゴリズムに多くの改良を加えている。
その結果、EOSisは、最先端の単一人口自己適応Dアルゴリズムと比較して高い性能を達成可能であることが証明された。
論文 参考訳(メタデータ) (2020-07-09T10:19:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。