論文の概要: Confidence-Aware Decision-Making and Control for Tool Selection
- arxiv url: http://arxiv.org/abs/2403.03808v1
- Date: Wed, 6 Mar 2024 15:59:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 14:37:09.007369
- Title: Confidence-Aware Decision-Making and Control for Tool Selection
- Title(参考訳): ツール選択のための信頼度対応意思決定と制御
- Authors: Ajith Anil Meera and Pablo Lanillos
- Abstract要約: 意思決定には、パフォーマンスに関する自己評価が不可欠です。
本稿では,ロボットが自己自信を制御し,より優れたインフォームド決定を行うことを可能にする数学的枠組みを提案する。
- 参考スコア(独自算出の注目度): 1.550120821358415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-reflecting about our performance (e.g., how confident we are) before
doing a task is essential for decision making, such as selecting the most
suitable tool or choosing the best route to drive. While this form of awareness
-- thinking about our performance or metacognitive performance -- is well-known
in humans, robots still lack this cognitive ability. This reflective monitoring
can enhance their embodied decision power, robustness and safety. Here, we take
a step in this direction by introducing a mathematical framework that allows
robots to use their control self-confidence to make better-informed decisions.
We derive a mathematical closed-form expression for control confidence for
dynamic systems (i.e., the posterior inverse covariance of the control action).
This control confidence seamlessly integrates within an objective function for
decision making, that balances the: i) performance for task completion, ii)
control effort, and iii) self-confidence. To evaluate our theoretical account,
we framed the decision-making within the tool selection problem, where the
agent has to select the best robot arm for a particular control task. The
statistical analysis of the numerical simulations with randomized 2DOF arms
shows that using control confidence during tool selection improves both real
task performance, and the reliability of the tool for performance under
unmodelled perturbations (e.g., external forces). Furthermore, our results
indicate that control confidence is an early indicator of performance and thus,
it can be used as a heuristic for making decisions when computation power is
restricted or decision-making is intractable. Overall, we show the advantages
of using confidence-aware decision-making and control scheme for dynamic
systems.
- Abstract(参考訳): タスクを行う前にパフォーマンス(例えば、どれだけ自信があるか)を自己反映することは、最も適切なツールの選択や、運転する最良のルートの選択など、意思決定に不可欠です。
私たちのパフォーマンスやメタ認知能力について考えるというこの種の認識は、人間にはよく知られているが、ロボットにはこの認知能力がない。
この反射モニタリングは、その具体的決定力、堅牢性、安全性を高めることができる。
そこで本研究では,ロボットが自己自信を制御し,より良いインフォームド決定を行う数学的枠組みを導入することにより,この方向への一歩を踏み出す。
動的システムの制御信頼度(つまり制御作用の後方逆共分散)を制御するための数学的閉形式表現を導出する。
このコントロールの信頼性は、意思決定のための客観的機能にシームレスに統合されます。
一 タスク完了のための性能
二 管理努力、及び
三 自己自信
ツール選択問題では,エージェントが特定の制御タスクに最適なロボットアームを選択する必要がある。
ランダム化2dofアームを用いた数値シミュレーションの統計的解析により,ツール選択時の制御信頼度は実作業性能と非モデル化摂動(外部力など)下での性能の信頼性を両立することが示された。
さらに,制御信頼度が性能の早期指標であることが示唆され,計算能力の制限や意思決定の難しさを判断するためのヒューリスティックとして利用することができる。
全体として,動的システムに対する信頼性を考慮した意思決定・制御方式の利点を示す。
関連論文リスト
- Criticality and Safety Margins for Reinforcement Learning [53.10194953873209]
我々は,定量化基盤真理とユーザにとっての明確な意義の両面から,批判的枠組みを定めようとしている。
エージェントがn連続的ランダム動作に対するポリシーから逸脱した場合の報酬の減少として真臨界を導入する。
我々はまた、真の臨界と統計的に単調な関係を持つ低オーバーヘッド計量であるプロキシ臨界の概念も導入する。
論文 参考訳(メタデータ) (2024-09-26T21:00:45Z) - "A Good Bot Always Knows Its Limitations": Assessing Autonomous System Decision-making Competencies through Factorized Machine Self-confidence [5.167803438665586]
Factorized Machine Self-confidence (FaMSeC)は、アルゴリズムによる意思決定プロセスを駆動する要因の全体的記述を提供する。
指標は、確率的意思決定アルゴリズムの幅広いクラスに埋め込まれた階層的な問題解決統計から導かれる。
FaMSeCは、アルゴリズムによる適合評価の良さを、様々な自律エージェントの設計に容易に組み込むことができる。
論文 参考訳(メタデータ) (2024-07-29T01:22:04Z) - Automatic AI controller that can drive with confidence: steering vehicle with uncertainty knowledge [3.131134048419781]
本研究は,機械学習フレームワークを用いた車両の横方向制御システムの開発に焦点をあてる。
確率論的学習モデルであるベイズニューラルネットワーク(BNN)を用いて不確実性定量化に対処する。
信頼しきい値を確立することで、手動による介入をトリガーし、安全なパラメータの外で動作した場合に、制御がアルゴリズムから解放されることを保証できます。
論文 参考訳(メタデータ) (2024-04-24T23:22:37Z) - Rational Decision-Making Agent with Internalized Utility Judgment [91.80700126895927]
大規模言語モデル(LLM)は目覚ましい進歩を示し、従来のNLPアプリケーションを超えて複雑な多段階決定タスクを実行できるエージェントにLLMを開発するための重要な努力を惹きつけている。
本稿では,RadAgentを提案する。このRadAgentは,経験探索とユーティリティ学習を含む反復的なフレームワークを通じて,合理性の発展を促進する。
ToolBenchデータセットの実験結果は、RadAgentがベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2023-08-24T03:11:45Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - Adaptive Autonomy in Human-on-the-Loop Vision-Based Robotics Systems [16.609594839630883]
コンピュータビジョンのアプローチは、自律ロボットシステムによって意思決定の指針として広く使われている。
特に人間が監督的な役割しか果たさないHuman-on-the-loop(HoTL)システムでは、高精度が重要です。
適応的自律性レベルに基づくソリューションを提案し,これらのモデルの信頼性の低下を検出する。
論文 参考訳(メタデータ) (2021-03-28T05:43:10Z) - Improving Robustness of Learning-based Autonomous Steering Using
Adversarial Images [58.287120077778205]
自動運転用画像入力における学習アルゴリズムw.r.tの堅牢性を解析するためのフレームワークについて紹介する。
感度分析の結果を用いて, 「操縦への学習」 タスクの総合的性能を向上させるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-26T02:08:07Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。