論文の概要: Fundamental Limits for Sensor-Based Control via the Gibbs Variational Principle
- arxiv url: http://arxiv.org/abs/2603.18454v1
- Date: Thu, 19 Mar 2026 03:33:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.973911
- Title: Fundamental Limits for Sensor-Based Control via the Gibbs Variational Principle
- Title(参考訳): ギブズ変分原理によるセンサ制御の基礎的限界
- Authors: Vincent Pacelli, Evangelos A. Theodorou,
- Abstract要約: 既存の情報理論アプローチは、センサが提供しなければならない情報を、制御されていないシステムに対して評価することで過大評価する。
部分的な観測条件下では,任意の因果フィードバック制御器の最小コストに対して低い限界を導出する。
非線形ダビンス車追跡問題では、自己整合境界はセンサノイズレベルの最適コストの大部分を捕捉するが、オープンループの変種は低騒音下では空白である。
- 参考スコア(独自算出の注目度): 20.027825170329827
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fundamental limits on the performance of feedback controllers are essential for benchmarking algorithms, guiding sensor selection, and certifying task feasibility -- yet few general-purpose tools exist for computing them. Existing information-theoretic approaches overestimate the information a sensor must provide by evaluating it against the uncontrolled system, producing bounds that degrade precisely when feedback is most valuable. We derive a lower bound on the minimum expected cost of any causal feedback controller under partial observations by applying the Gibbs variational principle to the joint path measure over states and observations. The bound applies to nonlinear, nonholonomic, and hybrid dynamics with unbounded costs and admits a self-consistent refinement: any good controller concentrates the state, which limits the information the sensor can extract, which tightens the bound. The resulting fixed-point equation has a unique solution computable by bisection, and we provide conditions under which the free energy minimization is provably convex, yielding a certifiably correct numerical bound. On a nonlinear Dubins car tracking problem, the self-consistent bound captures most of the optimal cost across sensor noise levels, while the open-loop variant is vacuous at low noise.
- Abstract(参考訳): フィードバックコントローラのパフォーマンスの基本的な制限は、アルゴリズムのベンチマーク、センサーの選択の誘導、タスクの実現可能性の証明に不可欠である。
既存の情報理論アプローチは、センサが提供しなければならない情報を、制御されていないシステムに対して評価することで過大評価し、フィードバックが最も価値のある場合に正確に劣化する境界を生成する。
我々は、ギブス変分原理を、状態や観測に対するジョイントパス測度に適用することにより、部分的な観測下での任意の因果フィードバック制御の最小コストを低くする。
境界は、非線形、非ホロノミック、ハイブリッドのダイナミクスに非有界なコストで適用され、自己整合的な改善が認められる: 優れたコントローラは状態に集中し、センサが抽出できる情報を制限する。
結果として得られる不動点方程式は、二分法で計算可能な一意解を持ち、自由エネルギーの最小化が証明可能凸であり、確実に正しい数値境界が得られる条件を提供する。
非線形ダビンス車追跡問題では、自己整合境界はセンサノイズレベルの最適コストの大部分を捕捉するが、オープンループの変種は低騒音下では空白である。
関連論文リスト
- Verifying Closed-Loop Contractivity of Learning-Based Controllers via Partitioning [52.23804865017831]
本稿では,ニューラルネットワークによるパラメータ化を行う非線形制御系における閉ループ収縮の検証問題に対処する。
我々は、対称メッツラー行列の優越的固有値が非正であることを確かめるために、閉ループの縮約性に対するトラクタブルでスケーラブルな十分条件を導出する。
論文 参考訳(メタデータ) (2025-12-01T23:06:56Z) - Constrained Reinforcement Learning using Distributional Representation for Trustworthy Quadrotor UAV Tracking Control [2.325021848829375]
本研究では, 未知の空力効果に対する分散強化学習障害推定器を統合した新しいトラジェクトリトラッカーを提案する。
提案手法は, 空気力学効果の真値と推定値の不確かさを正確に同定する。
本システムは,最近の技術と比較して,累積追尾誤差を少なくとも70%改善することを示した。
論文 参考訳(メタデータ) (2023-02-22T23:15:56Z) - Bandit Quickest Changepoint Detection [55.855465482260165]
すべてのセンサの継続的な監視は、リソースの制約のためにコストがかかる可能性がある。
有限パラメータ化確率分布の一般クラスに対する検出遅延に基づく情報理論の下界を導出する。
本稿では,異なる検知オプションの探索と質問行動の活用をシームレスに両立させる,計算効率のよいオンラインセンシング手法を提案する。
論文 参考訳(メタデータ) (2021-07-22T07:25:35Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Certainty Equivalent Perception-Based Control [29.216967322052785]
動的に達成可能な高密度サンプリングスキームの下で,非カーネル回帰に拘束される一様誤差を示す。
これにより、経路追跡のためにクローズドループの回帰器を使用する場合の準最適性に対する有限時間収束率が得られる。
論文 参考訳(メタデータ) (2020-08-27T18:45:40Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。