論文の概要: Tiny Recursive Control: Iterative Reasoning for Efficient Optimal Control
- arxiv url: http://arxiv.org/abs/2512.16824v1
- Date: Thu, 18 Dec 2025 18:05:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.194575
- Title: Tiny Recursive Control: Iterative Reasoning for Efficient Optimal Control
- Title(参考訳): Tiny Recursive Control: 効率的な最適制御のための反復推論
- Authors: Amit Jain, Richard Linares,
- Abstract要約: 直感的反復原理に基づくニューラルネットワークであるTiny Recursive Control(TRC)を提案する。
TRCは2階層の階層的潜在構造を通して、コンパクトネットワーク(約1.5Mパラメータ)を繰り返し適用する。
TRCはGPUと10MB以下のメモリに対してミリ秒スケールの推論しか必要とせず、ほぼ最適制御コストを実現する。
- 参考スコア(独自算出の注目度): 2.258690092379457
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural network controllers increasingly demand millions of parameters, and language model approaches push into the billions. For embedded aerospace systems with strict power and latency constraints, this scaling is prohibitive. We present Tiny Recursive Control (TRC), a neural architecture based on a counterintuitive principle: capacity can emerge from iteration depth rather than parameter count. TRC applies compact networks (approximately 1.5M parameters) repeatedly through a two-level hierarchical latent structure, refining control sequences by simulating trajectories and correcting based on tracking error. Because the same weights process every refinement step, adding iterations increases computation without increasing memory. We evaluate TRC on nonlinear control problems including oscillator stabilization and powered descent with fuel constraints. Across these domains, TRC achieves near-optimal control costs while requiring only millisecond-scale inference on GPU and under 10~MB memory, two orders of magnitude smaller than language model baselines. These results demonstrate that recursive reasoning, previously confined to discrete tasks, transfers effectively to continuous control synthesis.
- Abstract(参考訳): ニューラルネットワークコントローラはますます数百万のパラメータを必要としており、言語モデルアプローチは何十億にも達している。
厳格なパワーとレイテンシの制約のある組み込み空域システムでは、このスケーリングは禁じられている。
提案するTiny Recursive Control(TRC)は,パラメータ数ではなく反復深さからキャパシティを発生させるという直感的原理に基づくニューラルアーキテクチャである。
TRCは、2階層の階層的潜在構造を通して連続的にコンパクトネットワーク(約1.5Mパラメータ)を適用し、軌道をシミュレートし、追跡誤差に基づいて修正する。
同じ重みが改善ステップごとに処理するため、イテレーションの追加はメモリを増やさずに計算量を増やします。
我々は、振動子安定化や燃料制約付き動力降下を含む非線形制御問題に対するTRCの評価を行った。
これらの領域全体にわたって、RTCはGPUでのミリ秒スケールの推論と10~MB以下のメモリを必要としながら、ほぼ最適制御コストを達成している。
これらの結果は、以前は離散的なタスクに限られていた再帰的推論が、連続的な制御合成に効果的に移行することを示した。
関連論文リスト
- PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.4629647715623]
大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。
PT$2$-LLMを提案する。
その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文 参考訳(メタデータ) (2025-09-27T03:01:48Z) - Comba: Improving Bilinear RNNs with Closed-loop Control [57.800320390698516]
本稿では,これらのモデルの利点と限界を包括的に分析したBilinear RNNの概念を紹介する。
我々は,状態フィードバックと出力フィードバックの両補正を併用した,スカラー+低ランク状態遷移を取り入れた新しいバイリニアRNNであるCombaを提案する。
また,大規模コーパス上での340M/1.3Bパラメータのトレーニングモデルと,ハードウェア効率のよいチャンクワイド並列カーネルを実装した。
論文 参考訳(メタデータ) (2025-06-03T05:44:50Z) - MOGNET: A Mux-residual quantized Network leveraging Online-Generated weights [2.7036595757881323]
MOGNETは、リソース限定のハードウェアと互換性のあるコンパクトなモデルアーキテクチャである。
類似またはより低いモデルサイズで1%まで明確なギャップを保ち、より高い精度を達成することができる。
論文 参考訳(メタデータ) (2025-01-16T13:30:20Z) - Neural Operators for Boundary Stabilization of Stop-and-go Traffic [1.90298817989995]
本稿では,ニューラル演算子を用いたPDE境界制御設計への新しいアプローチを提案する。
本稿では,トラフィックPDEシステムの安定化を目的とした2種類のニューラル演算子学習手法を提案する。
特定の近似精度条件下では,NOをベースとした閉ループシステムは実用的に安定であることが証明された。
論文 参考訳(メタデータ) (2023-12-16T08:18:39Z) - CACTO: Continuous Actor-Critic with Trajectory Optimization -- Towards
global optimality [5.0915256711576475]
本稿では,Tlayy(TO)とReinforcement Learning(RL)を1つの軌道で組み合わせた,動的システムの連続制御のための新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-12T10:16:35Z) - Efficient Micro-Structured Weight Unification and Pruning for Neural
Network Compression [56.83861738731913]
ディープニューラルネットワーク(DNN)モデルは、特にリソース制限されたデバイスにおいて、実用的なアプリケーションに不可欠である。
既往の非構造的あるいは構造化された重量刈り法は、推論を真に加速することはほとんど不可能である。
ハードウェア互換のマイクロ構造レベルでの一般化された重み統一フレームワークを提案し,高い圧縮と加速度を実現する。
論文 参考訳(メタデータ) (2021-06-15T17:22:59Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z) - High-bandwidth nonlinear control for soft actuators with recursive
network models [1.4174475093445231]
本稿では,Newton-Raphson を用いたソフトアクチュエータの高帯域幅,軽量,非線形出力追跡手法を提案する。
この手法により、従来のRNNモデルと比較してモデルサイズを縮小し、制御ループ周波数を増大させることができる。
論文 参考訳(メタデータ) (2021-01-04T18:12:41Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。