論文の概要: Featurized Occupation Measures for Structured Global Search in Numerical Optimal Control
- arxiv url: http://arxiv.org/abs/2603.16231v1
- Date: Tue, 17 Mar 2026 08:17:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.894933
- Title: Featurized Occupation Measures for Structured Global Search in Numerical Optimal Control
- Title(参考訳): 数値最適制御における構造的大域探索のための機能的職業化対策
- Authors: Qi Wei, Jianfeng Tao, Haoyang Tan, Hongyu Nie,
- Abstract要約: 本稿では, 職業測定定式化のための有限次元原始二重インタフェースであるFeaturized Occupation Measure (FOM)を紹介する。
FOMは広範に数値的に抽出可能であり、明示的な弱形式スキームと暗黙的なシミュレーターまたはロールアウトに基づくサンプリング手法の両方をカバーしている。
ブロック編成証明書の場合,有限次元近似はブロックワイド誤差と複雑性制御により下位境界を証明した。
- 参考スコア(独自算出の注目度): 1.2091218906871861
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerical optimal control is commonly divided between globally structured but dimensionally intractable Hamilton-Jacobi-Bellman (HJB) methods and scalable but local trajectory optimization. We introduce the Featurized Occupation Measure (FOM), a finite-dimensional primal-dual interface for the occupation-measure formulation that unifies trajectory search and global HJB-type certification. FOM is broad yet numerically tractable, covering both explicit weak-form schemes and implicit simulator- or rollout-based sampling methods. Within this framework, approximate HJB subsolutions serve as intrinsic numerical certificates to directly evaluate and guide the primal search. We prove asymptotic consistency with the exact infinite-dimensional occupation-measure problem, and show that for block-organized feasible certificates, finite-dimensional approximation preserves certified lower bounds with blockwise error and complexity control. We also establish persistence of these lower bounds under time shifts and bounded model perturbations. Consequently, these structural properties render global certificates into flexible, reusable computational objects, establishing a systematic basis for certificate-guided optimization in nonlinear control.
- Abstract(参考訳): 数値最適制御は、大域的に構造化されているが、次元的に難解なハミルトン・ヤコビ・ベルマン法(HJB)とスケーラブルだが局所的な軌道最適化の2つに大別される。
本稿では, 軌跡探索とグローバルHJB型認証を統一した職業測定定式化のための有限次元原始的インタフェースであるFeaturized Occupation Measure (FOM)を紹介する。
FOMは広範に数値的に抽出可能であり、明示的な弱形式スキームと暗黙的なシミュレーターまたはロールアウトに基づくサンプリング手法の両方をカバーしている。
この枠組みの中で、近似的なHJBサブソリューションは、原始探索を直接評価し誘導する固有の数値証明として機能する。
また, 有限次元近似は, ブロック単位の誤差と複雑性の制御により, 証明された下位境界を維持していることを示す。
また、時間シフトと有界モデル摂動の下でこれらの下界の永続性を確立する。
結果として、これらの構造特性はグローバル証明書をフレキシブルで再利用可能な計算対象にし、非線形制御における証明書誘導最適化の体系的な基盤を確立する。
関連論文リスト
- Counterexample Guided Branching via Directional Relaxation Analysis in Complete Neural Network Verification [10.808953992870954]
ディープニューラルネットワークは例外的な性能を示すが、敵の摂動に弱いままである。
現在のデータフローアプローチは、静的に依存するブラインドリファインメントプロセスで動作する。
本稿では,Falsification に積極的に寄与するニューロンの分岐を優先する Directional Gap を導入するフレームワーク DRG-BaB を提案する。
論文 参考訳(メタデータ) (2026-03-16T04:57:44Z) - BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning [49.25750348525603]
BandPOは、信頼領域を動的で確率対応のクリッピング間隔に投影する統一理論演算子であるBandに取って代わる。
BandPOはカノニカルクリッピングやClip-Higherより一貫して優れ,エントロピー崩壊の軽減が図られている。
論文 参考訳(メタデータ) (2026-03-05T08:03:05Z) - IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。
本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文 参考訳(メタデータ) (2026-03-03T14:36:46Z) - GPU-friendly and Linearly Convergent First-order Methods for Certifying Optimal $k$-sparse GLMs [7.079949618914198]
ブランチ・アンド・バウンド(BnB)フレームワークは、パースペクティブ・リラクゼーションを使って最適性を証明できる。
これらの緩和を解く既存の手法は計算集約的であり、スケーラビリティを制限している。
我々は線形収束性と計算効率の両立した近位フレームワークを開発する。
論文 参考訳(メタデータ) (2026-03-01T22:26:09Z) - SCULPT: Constraint-Guided Pruned MCTS that Carves Efficient Paths for Mathematical Reasoning [11.991985041067638]
本稿では,モンテカルロ木探索(MCTS)における制約誘導手法SCULPTを紹介する。
SCULPTは、シンボルチェック(次元整合性、型整合性、大きさの正しさ、深さ制御、多様性)と構造パターンガイダンスを組み合わせることで、スコアとプルーンのアクションを出力する。
全体として、ドメイン認識の制約は効率と安定性を維持しながら精度を向上させることができる。
論文 参考訳(メタデータ) (2026-01-19T08:55:46Z) - SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - Spectral Embedding via Chebyshev Bases for Robust DeepONet Approximation [0.6752538702870791]
SpectralEmbeded DeepONet (SEDNet) は、トランクが座標入力ではなく、固定されたチェビシェフスペクトル辞書によって駆動される新しい変種である。
SEDNetは一貫して、DeepONet、FEDONet、SEDONetの間で最も低い相対的なL2エラーを達成しており、ベースラインのDeepONetよりも平均30~40%改善されている。
論文 参考訳(メタデータ) (2025-12-09T22:26:29Z) - Multi-Scale Manifold Alignment for Interpreting Large Language Models: A Unified Information-Geometric Framework [4.935224714809964]
我々は,LLM表現を局所的,中間的,大域的多様体に分解する情報幾何学的フレームワークであるマルチスケールマニフォールドアライメント(MSMA)を提案する。
我々は一貫した階層パターンを観察し、MSMAが複数の推定値の下でアライメントの指標を改善することを発見した。
異なるスケールでの制御された介入は、語彙の多様性、文構造、談話のコヒーレンスに区別され、アーキテクチャに依存した効果をもたらす。
論文 参考訳(メタデータ) (2025-05-24T10:25:58Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Validation Diagnostics for SBI algorithms based on Normalizing Flows [55.41644538483948]
本研究は,NFに基づく多次元条件(後)密度推定器の検証診断を容易にすることを提案する。
また、局所的な一貫性の結果に基づいた理論的保証も提供する。
この作業は、より良い特定モデルの設計を支援したり、新しいSBIアルゴリズムの開発を促進するのに役立つだろう。
論文 参考訳(メタデータ) (2022-11-17T15:48:06Z) - Posterior Differential Regularization with f-divergence for Improving
Model Robustness [95.05725916287376]
クリーン入力とノイズ入力のモデル後部差を規則化する手法に着目する。
後微分正則化を$f$-divergencesの族に一般化する。
実験の結果, 後方微分を$f$-divergenceで正規化することで, モデルロバスト性の向上が期待できることがわかった。
論文 参考訳(メタデータ) (2020-10-23T19:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。