論文の概要: Infinite-Horizon Ergodic Control via Kernel Mean Embeddings
- arxiv url: http://arxiv.org/abs/2604.01023v1
- Date: Wed, 01 Apr 2026 15:30:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.058251
- Title: Infinite-Horizon Ergodic Control via Kernel Mean Embeddings
- Title(参考訳): カーネル平均埋め込みによる無限水平エルゴディック制御
- Authors: Christian Hughes, Ian Abraham,
- Abstract要約: 本稿では、カーネル平均埋め込みに基づく無限水平エルゴディックコントローラを一般ドメイン上の長期被覆タスクに導出する。
既存のカーネルベースのエルゴディック制御手法は、一般的なカバレッジドメインに対して強力なカバレッジ保証を提供するが、その実用性は、サブエルゴディックな有限時間水平線に限られている。
- 参考スコア(独自算出の注目度): 3.9554530119952673
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper derives an infinite-horizon ergodic controller based on kernel mean embeddings for long-duration coverage tasks on general domains. While existing kernel-based ergodic control methods provide strong coverage guarantees on general coverage domains, their practical use has been limited to sub-ergodic, finite-time horizons due to intractable computational scaling, prohibiting its use for long-duration coverage. We resolve this scaling by deriving an infinite-horizon ergodic controller equipped with an extended kernel mean embedding error visitation state that recursively records state visitation. This extended state decouples past visitation from future control synthesis and expands ergodic control to infinite-time settings. In addition, we present a variation of the controller that operates on a receding-horizon control formulation with the extended error state. We demonstrate theoretical proof of asymptotic convergence of the derived controller and show preservation of ergodic coverage guarantees for a class of 2D and 3D coverage problems.
- Abstract(参考訳): 本稿では、カーネル平均埋め込みに基づく無限水平エルゴディックコントローラを一般ドメイン上の長期被覆タスクに導出する。
既存のカーネルベースのエルゴディック制御手法は、一般的なカバレッジドメインに対して強力なカバレッジ保証を提供するが、その実用性は、計算スケーリングの難しさにより、サブエルゴディックな有限時間水平線に限られており、長期のカバレッジには使用が禁止されている。
本研究では、カーネルを拡張した無限水平エルゴディック制御器を用いて、再帰的に状態訪問を記録可能な埋め込みエラー訪問状態を導出することで、このスケーリングを解消する。
この拡張状態は、過去の訪問を将来の制御合成から切り離し、エルゴード制御を無限時間設定に拡張する。
さらに, 遅延水平制御の定式化を拡張誤差状態で行う制御器の変種について述べる。
導出制御器の漸近収束の理論的証明と2次元および3次元の被覆問題に対するエルゴード被覆保証の保存を示す。
関連論文リスト
- Gated Condition Injection without Multimodal Attention: Towards Controllable Linear-Attention Transformers [69.60693631859411]
本稿では,線形アテンションアーキテクチャ上に構築された制御可能な拡散モデルについて検討する。
本稿では,SANA などのリニアアテンションバックボーンに適した新しい制御可能な拡散フレームワークを提案する。
提案手法は,線形アテンションモデルに基づく最先端の制御可能な生成性能を実現する。
論文 参考訳(メタデータ) (2026-03-29T12:31:34Z) - CFG-Ctrl: Control-Based Classifier-Free Diffusion Guidance [31.552164852288325]
スライディングモード制御CFG(SMC-CFG)を導入する。
SMC-CFGは、様々なガイダンス尺度において、セマンティックアライメントとロバストネスにおいて標準CFGを上回っている。
論文 参考訳(メタデータ) (2026-03-03T18:59:48Z) - Limits of Convergence-Rate Control for Open-Weight Safety [23.243652317091456]
本研究では,非対角的設定における一階と二階の最適化を実証的かつ実証的に遅くするアルゴリズムを開発した。
逆の設定では、幅広い収束率制御法の基本的限界を確立する。
論文 参考訳(メタデータ) (2026-02-21T15:32:27Z) - Attention in Constant Time: Vashista Sparse Attention for Long-Context Decoding with Exponential Guarantees [0.0]
大規模な言語モデルは、長いコンテキストに対する推論コストの大部分を注意に費やします。
我々はこの現象をキーベクトルの凸殻への射影として注意をモデル化することによって定式化する。
本稿では,クエリ毎に小さな候補セットを保持するドロップイン機構であるVasista Sparse Attentionを紹介する。
論文 参考訳(メタデータ) (2026-02-14T14:29:10Z) - Hierarchical JEPA Meets Predictive Remote Control in Beyond 5G Networks [24.374628979591872]
スケーラブルな予測制御のための階層型統合埋め込み予測アーキテクチャ(H-JEPA)を提案する。
状態を伝達する代わりに、デバイス観測は重要なダイナミクスを保持する低次元の埋め込みに符号化される。
H-JEPAは、最大42.83 %以上のデバイスを、制御性能を損なうことなく、限られた無線容量でサポートできる。
論文 参考訳(メタデータ) (2026-01-28T17:04:06Z) - Verifying Closed-Loop Contractivity of Learning-Based Controllers via Partitioning [52.23804865017831]
本稿では,ニューラルネットワークによるパラメータ化を行う非線形制御系における閉ループ収縮の検証問題に対処する。
我々は、対称メッツラー行列の優越的固有値が非正であることを確かめるために、閉ループの縮約性に対するトラクタブルでスケーラブルな十分条件を導出する。
論文 参考訳(メタデータ) (2025-12-01T23:06:56Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Deep Reinforcement Learning for Wireless Scheduling in Distributed Networked Control [37.10638636086814]
完全分散無線制御システム(WNCS)の周波数チャネル数に制限のある結合アップリンクとダウンリンクのスケジューリング問題を考える。
深層強化学習(DRL)に基づくフレームワークを開発した。
DRLにおける大きなアクション空間の課題に対処するために,新しいアクション空間削減法とアクション埋め込み法を提案する。
論文 参考訳(メタデータ) (2021-09-26T11:27:12Z) - Counterdiabatic control in the impulse regime [0.0]
我々は,高目標状態の忠実さを維持しつつ,反断熱駆動の実施に伴う追加のエネルギー的オーバーヘッドを低減できることを示した。
これは、Kibble-Zurek機構によって特定されるインパルス状態においてのみ制御フィールドを実装することで実現される。
論文 参考訳(メタデータ) (2021-09-21T12:57:57Z) - Policy Analysis using Synthetic Controls in Continuous-Time [101.35070661471124]
因果推論における手法開発において, 合成制御を用いた因果推定は最も成功した手法の1つである。
本稿では,制御された微分方程式の定式化を明示的に用い,潜在反事実経路をモデル化する連続時間代替法を提案する。
論文 参考訳(メタデータ) (2021-02-02T16:07:39Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。