論文の概要: Base Placement Optimization for Coverage Mobile Manipulation Tasks
- arxiv url: http://arxiv.org/abs/2304.08246v1
- Date: Mon, 17 Apr 2023 13:04:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 15:18:44.821143
- Title: Base Placement Optimization for Coverage Mobile Manipulation Tasks
- Title(参考訳): 被覆移動操作タスクのベースプレースメント最適化
- Authors: Huiwen Zhang, Kai Mi, Zhijun Zhang
- Abstract要約: 本稿では,基本配置最適化問題を多目的最適化問題(MOOP)として定式化する。
本稿では,BPOを多目的最適化問題(MOOP)として定式化する。
実験により、最適化されたBPはタスクのカバレッジと効率を大幅に改善できることが示された。
- 参考スコア(独自算出の注目度): 6.217860411034386
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Base placement optimization (BPO) is a fundamental capability for mobile
manipulation and has been researched for decades. However, it is still very
challenging for some reasons. First, compared with humans, current robots are
extremely inflexible, and therefore have higher requirements on the accuracy of
base placements (BPs). Second, the BP and task constraints are coupled with
each other. The optimal BP depends on the task constraints, and in BP will
affect task constraints in turn. More tricky is that some task constraints are
flexible and non-deterministic. Third, except for fulfilling tasks, some other
performance metrics such as optimal energy consumption and minimal execution
time need to be considered, which makes the BPO problem even more complicated.
In this paper, a Scale-like disc (SLD) representation of the workspace is used
to decouple task constraints and BPs. To evaluate reachability and return
optimal working pose over SLDs, a reachability map (RM) is constructed offline.
In order to optimize the objectives of coverage, manipulability, and time cost
simultaneously, this paper formulates the BPO as a multi-objective optimization
problem (MOOP). Among them, the time optimal objective is modeled as a
traveling salesman problem (TSP), which is more in line with the actual
situation. The evolutionary method is used to solve the MOOP. Besides, to
ensure the validity and optimality of the solution, collision detection is
performed on the candidate BPs, and solutions from BPO are further fine-tuned
according to the specific given task. Finally, the proposed method is used to
solve a real-world toilet coverage cleaning task. Experiments show that the
optimized BPs can significantly improve the coverage and efficiency of the
task.
- Abstract(参考訳): ベース配置最適化(bpo)はモバイル操作の基本的な機能であり、何十年も研究されてきた。
しかし、いくつかの理由でまだ非常に難しい。
第一に、人間と比較すると、現在のロボットは非常に柔軟であり、したがってベース配置の精度(BPs)が高い。
次に、bpとタスクの制約が互いに結合される。
最適BPはタスク制約に依存し、BPではタスク制約に影響を及ぼす。
もっと難しいのは、タスクの制約が柔軟で非決定論的であることです。
第三に、タスクを遂行する以外は、最適エネルギー消費や最小実行時間といった他のパフォーマンス指標も考慮する必要があるため、BPO問題はさらに複雑になる。
本稿では、タスク制約とBPを分離するために、ワークスペースのスケールライクディスク(SLD)表現を用いる。
SLD上での到達性と最適動作ポーズを評価するために、到達性マップ(RM)をオフラインで構築する。
本稿では,BPOを多目的最適化問題(MOOP)として定式化する。
その中でも, 時間最適目標をトラベルセールスマン問題(tsp)としてモデル化し, 実際の状況とより一致している。
進化法は MOOP を解くために用いられる。
さらに、解の有効性と最適性を確保するため、候補BP上で衝突検出を行い、特定のタスクに応じてBPOからの解をさらに微調整する。
最後に,実際のトイレの清掃作業を解決するために提案手法を用いた。
実験により、最適化されたBPはタスクのカバレッジと効率を大幅に改善できることが示された。
関連論文リスト
- Hierarchical Preference Optimization: Learning to achieve goals via feasible subgoals prediction [71.81851971324187]
本研究は階層型強化学習(HRL)の新しいアプローチである階層型優先度最適化(HPO)を導入する。
HPOは、複雑なロボット制御タスクを解く際に、非定常性と非実用的なサブゴール生成の問題に対処する。
挑戦的なロボットナビゲーションと操作タスクの実験はHPOの素晴らしいパフォーマンスを示しており、ベースラインよりも最大35%改善されている。
論文 参考訳(メタデータ) (2024-11-01T04:58:40Z) - Towards Efficient Exact Optimization of Language Model Alignment [93.39181634597877]
嗜好データから直接ポリシーを最適化するために、直接選好最適化(DPO)が提案された。
問題の最適解に基づいて導出されたDPOが,現実の最適解の妥協平均探索近似に繋がることを示す。
本稿では、アライメント目的の効率的な精度最適化(EXO)を提案する。
論文 参考訳(メタデータ) (2024-02-01T18:51:54Z) - Learning Regions of Interest for Bayesian Optimization with Adaptive
Level-Set Estimation [84.0621253654014]
本稿では,高信頼領域を適応的にフィルタするBALLETというフレームワークを提案する。
理論的には、BALLETは探索空間を効率的に縮小することができ、標準BOよりも厳密な後悔を示すことができる。
論文 参考訳(メタデータ) (2023-07-25T09:45:47Z) - Optimal Cost-Preference Trade-off Planning with Multiple Temporal Tasks [3.655021726150368]
個別のタスクやその関係性よりも好みを表現できる汎用的な枠組みを提供する新しい選好概念を導入する。
我々は,ユーザの好みに従属する行動と,リソース最適である行動の最適トレードオフ(Pareto)分析を行う。
論文 参考訳(メタデータ) (2023-06-22T21:56:49Z) - Large-Batch, Iteration-Efficient Neural Bayesian Design Optimization [37.339567743948955]
本稿では,BOの限界に対処するための新しいベイズ最適化フレームワークを提案する。
我々の重要な貢献は、高度にスケーラブルでサンプルベースの取得機能であり、非支配的な目的のソートを実行する。
我々は,ベイズ型ニューラルネットワークサロゲートと組み合わせることで,最小限の反復数でデータ集約環境に有効であることを示す。
論文 参考訳(メタデータ) (2023-06-01T19:10:57Z) - Deep Attentive Belief Propagation: Integrating Reasoning and Learning
for Solving Constraint Optimization Problems [24.63675651321079]
BP(Breief Propagation)は、グラフィカルモデル上の様々な推論タスクのための重要なメッセージパッシングアルゴリズムである。
本研究では, DABP をスムーズなソリューションコストで自己教師付き学習する手法を提案する。
我々のモデルは最先端のベースラインを大きく上回る。
論文 参考訳(メタデータ) (2022-09-24T13:03:46Z) - Pareto Frontier Approximation Network (PA-Net) to Solve Bi-objective TSP [1.4884785898657995]
トラベリングセールスパーソン問題(TSP)は、一連のタスクを行う最適な順序を見つけるために使用される古典的なリソース割り当て問題である。
本稿では,Pareto フロントの良好な近似を生成するネットワークであるPA-Netについて述べる。
また,ロボットナビゲーションタスク/カバレッジ計画において,PA-Netを用いて最適な訪問順序を求める。
論文 参考訳(メタデータ) (2022-03-02T18:25:45Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z) - Provably Efficient Exploration in Policy Optimization [117.09887790160406]
本稿では,最適化アルゴリズム(OPPO)の最適変種を提案する。
OPPO は $tildeO(sqrtd2 H3 T )$ regret を達成する。
我々の知る限りでは、OPPOは、探索する最初の証明可能な効率的なポリシー最適化アルゴリズムである。
論文 参考訳(メタデータ) (2019-12-12T08:40:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。