Fugu-MT 論文翻訳(概要): Data-efficient, Explainable and Safe Payload Manipulation: An Illustration of the Advantages of Physical Priors in Model-Predictive Control

論文の概要: Data-efficient, Explainable and Safe Payload Manipulation: An Illustration of the Advantages of Physical Priors in Model-Predictive Control

arxiv url: http://arxiv.org/abs/2303.01563v1
Date: Thu, 2 Mar 2023 20:28:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-06 17:06:11.009837
Title: Data-efficient, Explainable and Safe Payload Manipulation: An Illustration of the Advantages of Physical Priors in Model-Predictive Control
Title（参考訳）: データ効率、説明可能、そして安全なペイロード操作:モデル予測制御における物理プライオリティの利点の例
Authors: Achkan Salehi, Stephane Doncieux
Abstract要約: 環境のダイナミクスに関する事前の知識は、説明可能性の向上と、安全性とデータ効率の両面での増大につながることを示す。実際のロボットシステムに基づくペイロード操作問題をモデル化し、環境のダイナミクスに関する事前知識を活用することにより、説明可能性の向上と安全性とデータ効率の向上につながることを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Machine Learning methods, such as those from the Reinforcement Learning (RL) literature, have increasingly been applied to robot control problems. However, such control methods, even when learning environment dynamics (e.g. as in Model-Based RL/control) often remain data-inefficient. Furthermore, the decisions made by learned policies or the estimations made by learned dynamic models, unlike those made by their hand-designed counterparts, are not readily interpretable by a human user without the use of Explainable AI techniques. This has several disadvantages, such as increased difficulty both in debugging and integration in safety-critical systems. On the other hand, in many robotic systems, prior knowledge of environment kinematics and dynamics is at least partially available (e.g. from classical mechanics). Arguably, incorporating such priors to the environment model or decision process can help address the aforementioned problems: it reduces problem complexity and the needs in terms of exploration, while also facilitating the expression of the decisions taken by the agent in terms of physically meaningful entities. Our aim with this paper is to illustrate and support this point of view. We model a payload manipulation problem based on a real robotic system, and show that leveraging prior knowledge about the dynamics of the environment can lead to improved explainability and an increase in both safety and data-efficiency,leading to satisfying generalization properties with less data.
Abstract（参考訳）: 強化学習(Reinforcement Learning, RL)文学などの機械学習手法は、ロボット制御問題にますます応用されている。しかし、そのような制御手法は、学習環境力学(例えば、モデルベースRL/制御など)がデータ非効率のままである場合であっても、しばしば存在する。さらに、学習方針による決定や学習された動的モデルによる推定は、手作業で設計されたものとは異なり、説明可能なAI技術を使わずに人間のユーザによって容易に解釈できない。これには、デバッグとセーフティクリティカルなシステムの統合の難しさの増加など、いくつかの欠点がある。一方、多くのロボットシステムでは、環境運動学や力学の事前知識は少なくとも部分的に利用可能である(例えば古典力学)。環境モデルや意思決定プロセスにそのような優先順位を組み込むことは、上記の問題に対処するのに役立ちます。本稿の目的は,この視点を説明し,支持することである。実際のロボットシステムに基づいてペイロード操作問題をモデル化し,環境のダイナミクスに関する事前知識を活用すれば,より少ないデータで一般化特性を満足できるため,説明可能性の向上と安全性とデータ効率の向上が期待できることを示した。

関連論文リスト

SwS: Self-aware Weakness-driven Problem Synthesis in Reinforcement Learning for LLM Reasoning [95.28059121743831]
RLVR(Reinforcement Learning with Verifiable Rewards)は、複雑な推論タスクにおいて、大規模言語モデル(LLM)のトレーニングに有効であることが証明されている。本稿では、モデル欠陥を体系的に識別し、それらを問題解決に活用する自己認識弱さ駆動型問題合成フレームワーク(SwS)を提案する。 SwSはモデルを自己識別し、RLの弱点に対処することで堅牢な一般化を可能にし、7Bモデルと32Bモデルで平均パフォーマンスが10.0%と7.7%向上した。
論文参考訳（メタデータ） (2025-06-10T17:02:00Z)
Soft Weighted Machine Unlearning [7.696293975773435]
凸2次プログラミング問題を解析的に解くことにより、各サンプルに調整された重みを割り当てる重み付き影響関数を導入する。提案したソフトウェイト方式は汎用性が高く,既存のほとんどの未学習アルゴリズムにシームレスに統合可能であることを実証する。フェアネスとロバストネス駆動のタスクにおいて、ソフトウェイトされたスキームは、フェアネス/ロバストネスの指標においてハードウェイトされたスキームを著しく上回る。
論文参考訳（メタデータ） (2025-05-24T16:40:14Z)
Predicting Human Behavior in Autonomous Systems: A Collaborative Machine Teaching Approach for Reducing Transfer of Control Events [0.0]
Transfer of Control (ToC)は、障害時に自動化プロセスを中断するための従来のアプローチである。本稿では,人間のインタラクションデータを用いて,問題の事前特定と対処が可能なAIモデルを訓練するデータ駆動手法を提案する。その結果,非専門家からのデータでさえ,不要なToCイベントを減らすために効果的にモデルをトレーニングできることが判明した。
論文参考訳（メタデータ） (2025-05-15T20:34:29Z)
ToolACE-DEV: Self-Improving Tool Learning via Decomposition and EVolution [77.86222359025011]
ツール学習のための自己改善フレームワークであるToolACE-DEVを提案する。まず、ツール学習の目的を、基本的なツール作成とツール利用能力を高めるサブタスクに分解する。次に、軽量モデルによる自己改善を可能にする自己進化パラダイムを導入し、高度なLCMへの依存を減らす。
論文参考訳（メタデータ） (2025-05-12T12:48:30Z)
Explainable AI for UAV Mobility Management: A Deep Q-Network Approach for Handover Minimization [4.7430397428031785]
本稿では、さまざまな状態パラメータがハンドオーバ決定にどのように影響するかについて、より深い洞察を提供するための、説明可能なAI(XAI)フレームワークを紹介する。参照信号受信電力(RSRP)などの重要な特徴の影響を定量化することにより、RLベースのハンドオーバソリューションの解釈可能性と信頼性を向上させる。
論文参考訳（メタデータ） (2025-04-25T14:11:51Z)
Physics-informed data-driven control without persistence of excitation [2.447795279790662]
システムの再識別を許可する十分な情報を持たないデータは、システム外部や物理的知識と組み合わせて意味のある情報を提供することができることを示す。次に、この情報を安全とエネルギーの最小化問題にどのように活用するかを説明し、非モデル化力学における予測を強化する。
論文参考訳（メタデータ） (2025-04-11T12:19:51Z)
Paving the way for scientific foundation models: enhancing generalization and robustness in PDEs with constraint-aware pre-training [49.8035317670223]
科学基盤モデル(SciFM)は、様々な領域にまたがる伝達可能な表現を学習するための有望なツールとして登場しつつある。本稿では,PDE残差を単独の学習信号として,あるいはデータ損失と組み合わせて事前学習に組み込むことにより,限定的あるいは実用的でないトレーニングデータに補償することを提案する。以上の結果から, PDE制約による事前学習は, 解データのみを訓練したモデルよりも, 一般化を著しく向上させることが示された。
論文参考訳（メタデータ） (2025-03-24T19:12:39Z)
Harnessing physics-informed operators for high-dimensional reliability analysis problems [0.8192907805418583]
信頼性分析(Reliability analysis)は、特に多数のパラメータを持つシステムにおいて、非常に難しいタスクである。信頼性を定量化するための従来の手法は、しばしば広範なシミュレーションや実験データに依存している。物理インフォームド演算子は,高次元信頼性解析問題を妥当な精度でシームレスに解くことができることを示す。
論文参考訳（メタデータ） (2024-09-07T04:52:03Z)
Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文参考訳（メタデータ） (2024-02-07T21:58:40Z)
Effective Communication with Dynamic Feature Compression [25.150266946722]
本研究では,タスクを制御するロボットに対して,観察者が知覚データを伝達しなければならないプロトタイパルシステムについて検討する。本稿では, 量子化レベルを動的に適応させるために, アンサンブルベクトル量子化変分オートエンコーダ(VQ-VAE)を符号化し, 深層強化学習(DRL)エージェントを訓練する。我々は、よく知られたCartPole参照制御問題に対して提案手法を検証し、大幅な性能向上を得た。
論文参考訳（メタデータ） (2024-01-29T15:35:05Z)
A spectrum of physics-informed Gaussian processes for regression in engineering [0.0]
センサとデータ全般の可用性は向上していますが、純粋なデータ駆動アプローチから多くのサービス内エンジニアリングシステムや構造を完全に特徴づけることはできません。本稿では、限られたデータで予測モデルを作成する能力を高めるために、機械学習技術と物理に基づく推論の組み合わせを追求する。
論文参考訳（メタデータ） (2023-09-19T14:39:03Z)
On Robust Numerical Solver for ODE via Self-Attention Mechanism [82.95493796476767]
我々は,内在性雑音障害を緩和し,AIによって強化された数値解法を,データサイズを小さくする訓練について検討する。まず,教師付き学習における雑音を制御するための自己認識機構の能力を解析し,さらに微分方程式の数値解に付加的な自己認識機構を導入し,簡便かつ有効な数値解法であるAttrを提案する。
論文参考訳（メタデータ） (2023-02-05T01:39:21Z)
Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。 DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文参考訳（メタデータ） (2022-06-30T17:59:49Z)
How Can Subgroup Discovery Help AIOps? [0.0]
サブグループディスカバリがAIOpsにどのように役立つかを研究する。このプロジェクトには、フランスのソフトウェアエディタであるInfologicalのデータマイニングの研究者と実践者の両方が含まれる。
論文参考訳（メタデータ） (2021-09-10T14:41:02Z)
Counterfactual Explanations as Interventions in Latent Space [62.997667081978825]
反現実的な説明は、望ましい結果を達成するために変更が必要な機能のセットをエンドユーザに提供することを目的としています。現在のアプローチでは、提案された説明を達成するために必要な行動の実現可能性を考慮することはめったにない。本稿では,非現実的説明を生成する手法として,潜時空間における干渉としての対実的説明(CEILS)を提案する。
論文参考訳（メタデータ） (2021-06-14T20:48:48Z)
Offline Model-Based Optimization via Normalized Maximum Likelihood Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文参考訳（メタデータ） (2021-02-16T06:04:27Z)
Sufficiently Accurate Model Learning for Planning [119.80502738709937]
本稿では,制約付きSufficiently Accurateモデル学習手法を提案する。これはそのような問題の例を示し、いくつかの近似解がいかに近いかという定理を提示する。近似解の質は、関数のパラメータ化、損失と制約関数の滑らかさ、モデル学習におけるサンプルの数に依存する。
論文参考訳（メタデータ） (2021-02-11T16:27:31Z)
Variational Autoencoding of PDE Inverse Problems [12.716429755564821]
現代の機械学習は、事前の知識と物理法則に関わる問題を回避できる。この作業では、メカニスティックモデルをフレキシブルなデータ駆動サロゲートに折り畳み、物理的に構造化されたデコーダネットワークに到達する。我々はPDE問題の変分形式を採用し,局所近似をモデルベースデータ拡張の形式として導入する。
論文参考訳（メタデータ） (2020-06-28T16:17:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。