論文の概要: A Model for Optimal Resilient Planning Subject to Fallible Actuators
- arxiv url: http://arxiv.org/abs/2405.11402v1
- Date: Sat, 18 May 2024 22:07:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-21 17:59:18.182349
- Title: A Model for Optimal Resilient Planning Subject to Fallible Actuators
- Title(参考訳): フォールブルアクチュエータの最適弾力性設計モデル
- Authors: Kyle Baldes, Diptanil Chaudhuri, Jason M. O'Kane, Dylan A. Shell,
- Abstract要約: 我々は,Markov Decision Processes (MDP) フレームワーク内での故障を受けやすいアクチュエータによる計画の問題を定式化する。
このモデルは、利用駆動型故障とアクチュエータ故障の状態依存確率をキャプチャする。
我々は、構成が密接に関連する問題を生じさせるという観察を生かして、再使用による計算を省く機会を見出した。
- 参考スコア(独自算出の注目度): 28.11583381961291
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robots incurring component failures ought to adapt their behavior to best realize still-attainable goals under reduced capacity. We formulate the problem of planning with actuators known a priori to be susceptible to failure within the Markov Decision Processes (MDP) framework. The model captures utilization-driven malfunction and state-action dependent likelihoods of actuator failure in order to enable reasoning about potential impairment and the long-term implications of impoverished future control. This leads to behavior differing qualitatively from plans which ignore failure. As actuators malfunction, there are combinatorially many configurations which can arise. We identify opportunities to save computation through re-use, exploiting the observation that differing configurations yield closely related problems. Our results show how strategic solutions are obtained so robots can respond when failures do occur -- for instance, in prudently scheduling utilization in order to keep critical actuators in reserve.
- Abstract(参考訳): コンポーネント障害を引き起こすロボットは、キャパシティの低下の下で、持続可能な目標を最大限に達成するために、行動に適応すべきである。
我々は、マルコフ決定プロセス(MDP)フレームワークで失敗するおそれのあるアクチュエーターを設計する際の問題を定式化する。
このモデルは、潜在的障害の推論と将来の制御不足の長期的影響を可能にするために、アクチベーター故障の有効利用駆動障害と状態依存確率をキャプチャする。
これは、失敗を無視する計画と定性的に異なる振る舞いをもたらす。
アクチュエータの故障として、組合せ的に多くの構成が生じる。
我々は、異なる構成が密接に関連する問題をもたらすという観察を生かして、再使用による計算を省く機会を見出した。
私たちの結果は、ロボットが障害が発生した時に応答できるように、戦略的ソリューションがどのように得られるかを示しています。
関連論文リスト
- Adaptive Motion Generation Using Uncertainty-Driven Foresight Prediction [2.2120851074630177]
環境の不確実性は、現実のロボットタスクを実行する際には、長年、扱いにくい特徴だった。
本稿では,動的内部シミュレーションを用いたフォレスト予測を用いた既存の予測学習に基づくロボット制御手法を拡張した。
その結果,提案モデルではドアとの相互作用により動作が適応的に分岐し,従来の手法では安定に分岐しなかった。
論文 参考訳(メタデータ) (2024-10-01T15:13:27Z) - Adaptable Recovery Behaviors in Robotics: A Behavior Trees and Motion Generators(BTMG) Approach for Failure Management [0.0]
本稿では,リカバリ動作を適応可能なロボット技術としてモデル化し,行動木と動作生成器(BTMG)フレームワークをポリシー表現に活用する手法を提案する。
我々は,ペグ・イン・ア・ホール作業における一連の段階的なシナリオを通じて方法論を評価し,ロボットの協調作業における作業効率の向上とタスク成功率の向上に対するアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2024-04-09T08:56:43Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Partially Observable Task and Motion Planning with Uncertainty and Risk Awareness [34.77182116081535]
統合型タスク・アンド・モーション・プランニング(TAMP)は、長期のロボット操作とナビゲーションの問題を一般化するための貴重なアプローチであることが証明されている。
これらの仮定は、プランナーが情報を収集し、リスクを認識した意思決定を行う能力を制限します。
本研究では,初期状態と行動結果の不確実性を伴う長期計画問題を効果的に解決できる不確実性とリスク認識(TAMPURA)を備えたTAMP戦略を提案する。
論文 参考訳(メタデータ) (2024-03-15T16:42:14Z) - Modeling Boundedly Rational Agents with Latent Inference Budgets [56.24971011281947]
エージェントの計算制約を明示的にモデル化する潜在推論予算モデル(L-IBM)を導入する。
L-IBMは、最適なアクターの多様な集団のデータを使ってエージェントモデルを学ぶことができる。
我々は,L-IBMが不確実性の下での意思決定のボルツマンモデルに適合しているか,あるいは上回っていることを示す。
論文 参考訳(メタデータ) (2023-12-07T03:55:51Z) - Causal Disentanglement Hidden Markov Model for Fault Diagnosis [55.90917958154425]
本研究では, 軸受破壊機構の因果性を学ぶために, 因果解離隠れマルコフモデル (CDHM) を提案する。
具体的には、時系列データをフル活用し、振動信号を断層関連要因と断層関連要因に段階的に分解する。
アプリケーションの範囲を広げるために、学習された非絡み合った表現を他の作業環境に転送するために、教師なしのドメイン適応を採用する。
論文 参考訳(メタデータ) (2023-08-06T05:58:45Z) - Active learning for structural reliability analysis with multiple limit
state functions through variance-enhanced PC-Kriging surrogate models [0.0]
既存のサロゲートモデルをトレーニングするためのアクティブな戦略は、正確な構造的信頼度を推定する。
本研究は,限られた計算予算の下で学習サンプルを効率的に選択するための能動的学習手法の能力について検討する。
論文 参考訳(メタデータ) (2023-02-23T15:01:06Z) - Active Uncertainty Reduction for Safe and Efficient Interaction
Planning: A Shielding-Aware Dual Control Approach [9.07774184840379]
本稿では,暗黙的二重制御パラダイムに基づく対話型動作計画における能動的不確実性低減を実現するアルゴリズムを提案する。
提案手法は, 動的プログラミングのサンプリングに基づく近似に依拠し, リアルタイム勾配最適化法で容易に解けるモデル予測制御問題に導かれる。
論文 参考訳(メタデータ) (2023-02-01T01:34:48Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - Contingencies from Observations: Tractable Contingency Planning with
Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。
本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。
このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文 参考訳(メタデータ) (2021-04-21T14:30:20Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。