論文の概要: Differentiable Weightless Controllers: Learning Logic Circuits for Continuous Control
- arxiv url: http://arxiv.org/abs/2512.01467v1
- Date: Mon, 01 Dec 2025 09:50:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.789912
- Title: Differentiable Weightless Controllers: Learning Logic Circuits for Continuous Control
- Title(参考訳): 微分可能ウェイトレスコントローラ:連続制御のための論理回路の学習
- Authors: Fabian Kresse, Christoph H. Lampert,
- Abstract要約: 実測値を行動にマッピングするシンボル微分可能なアーキテクチャであるDWC(Dariable Weightless Controllers)を導入する。
DWCは勾配に基づく手法でエンドツーエンドで訓練できるが、FPGA互換回路に直接コンパイルできる。
- 参考スコア(独自算出の注目度): 18.73809027808152
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate whether continuous-control policies can be represented and learned as discrete logic circuits instead of continuous neural networks. We introduce Differentiable Weightless Controllers (DWCs), a symbolic-differentiable architecture that maps real-valued observations to actions using thermometer-encoded inputs, sparsely connected boolean lookup-table layers, and lightweight action heads. DWCs can be trained end-to-end by gradient-based techniques, yet compile directly into FPGA-compatible circuits with few- or even single-clock-cycle latency and nanojoule-level energy cost per action. Across five MuJoCo benchmarks, including high-dimensional Humanoid, DWCs achieve returns competitive with weight-based policies (full precision or quantized neural networks), matching performance on four tasks and isolating network capacity as the key limiting factor on HalfCheetah. Furthermore, DWCs exhibit structurally sparse and interpretable connectivity patterns, enabling a direct inspection of which input thresholds influence control decisions.
- Abstract(参考訳): 連続的なニューラルネットワークの代わりに、離散論理回路として連続制御ポリシーを表現・学習できるかどうかを検討する。
DWCは,実測値を温度計エンコードされた入力,疎結合なブールアンルックアップテーブル層,軽量なアクションヘッドを用いたアクションにマッピングする,記号微分可能なアーキテクチャである。
DWCは勾配に基づく手法でエンドツーエンドにトレーニングできるが、FPGA互換の回路に直接コンパイルし、数または1クロックサイクルのレイテンシとナノジュールレベルのエネルギーコストがかかる。
高次元ヒューマノイドを含む5つのMuJoCoベンチマークは、重量ベースのポリシー(完全精度または量子化ニューラルネットワーク)と競合するリターンを達成し、4つのタスクのパフォーマンスにマッチし、HalfCheetahの重要な制限要因としてネットワーク容量を分離する。
さらに、DWCは構造的にスパースで解釈可能な接続パターンを示し、どの入力しきい値が制御決定に影響を与えるかを直接検査することができる。
関連論文リスト
- Cross-Layer Detection of Wireless Misbehavior Using 5G RAN Telemetry and Operational Metadata [0.0]
本研究では,物理層計測,MACスケジューリング決定,構成メタデータのコヒーレンスに及ぼす操作の影響について検討する。
すべての操作は、単一のテレメトリソースから見えない、明瞭で再現可能なシグネチャを生成する。
クロス層コヒーレンス(英語版)は標準のgNBテレメトリのみを用いてアップリンク誤りを検出する実用的な信号を提供することを示す。
論文 参考訳(メタデータ) (2025-11-26T18:53:26Z) - CLASS: A Controller-Centric Layout Synthesizer for Dynamic Quantum Circuits [58.16162138294308]
CLASSは、分散制御システムにおけるコントローラ間通信遅延を低減するために設計された、コントローラ中心のレイアウトシンセサイザーである。
評価の結果、CLASSは通信遅延を最大100%減らし、追加操作数の平均2.10%しか増加しないことがわかった。
論文 参考訳(メタデータ) (2025-09-19T08:11:55Z) - Integrated Sensing, Communication, and Computation for Over-the-Air Federated Edge Learning [52.904670248426626]
本稿では,統合されたセンサ,通信,計算機能を備えた空対空フェデレーションエッジ・ラーニング(Air-FEEL)システムについて検討する。
バッチサイズ制御とネットワークリソース割り当てを交互に最適化することにより、低複雑さI SCCアルゴリズムを導出する。
論文 参考訳(メタデータ) (2025-08-21T02:46:46Z) - Optimal Controller Realizations against False Data Injections in Cooperative Driving [2.2134894590368748]
本研究では,False-Data Injection(FDI)攻撃の効果を緩和するためのコントローラ指向アプローチについて検討する。
我々は,新しいが等価なコントローラのクラスがベースコントローラを表現可能であることを示す。
FDI攻撃の影響を最小限に抑えるセンサの最適組み合わせを得る。
論文 参考訳(メタデータ) (2024-04-08T09:53:42Z) - Neural Operators for Boundary Stabilization of Stop-and-go Traffic [1.90298817989995]
本稿では,ニューラル演算子を用いたPDE境界制御設計への新しいアプローチを提案する。
本稿では,トラフィックPDEシステムの安定化を目的とした2種類のニューラル演算子学習手法を提案する。
特定の近似精度条件下では,NOをベースとした閉ループシステムは実用的に安定であることが証明された。
論文 参考訳(メタデータ) (2023-12-16T08:18:39Z) - Graph test of controllability in qubit arrays: A systematic way to
determine the minimum number of external controls [62.997667081978825]
我々は、ハミルトニアンのグラフ表現に基づいて、結合された量子ビットの配列の可制御性を決定する方法を示す。
複雑な量子ビット結合では、制御数を5から1に減らすことができる。
論文 参考訳(メタデータ) (2022-12-09T12:59:44Z) - Reachable Polyhedral Marching (RPM): An Exact Analysis Tool for Deep-Learned Control Systems [11.93664682521114]
我々は、rerectified Unit (ReLU) アクティベーションを備えたフィードフォワードニューラルネットワークに注目した。
本稿では,アフィン領域の増分および連結を利用したROA計算アルゴリズムを提案する。
最後に,航空機の滑走路制御問題に対する画像ベース制御器によって安定化された状態の集合を見つけるために,本手法を適用した。
論文 参考訳(メタデータ) (2022-10-15T17:15:53Z) - Model-based Deep Learning Receiver Design for Rate-Splitting Multiple
Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。
MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。
その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文 参考訳(メタデータ) (2022-05-02T12:23:55Z) - Deep Reinforcement Learning for Wireless Scheduling in Distributed Networked Control [37.10638636086814]
完全分散無線制御システム(WNCS)の周波数チャネル数に制限のある結合アップリンクとダウンリンクのスケジューリング問題を考える。
深層強化学習(DRL)に基づくフレームワークを開発した。
DRLにおける大きなアクション空間の課題に対処するために,新しいアクション空間削減法とアクション埋め込み法を提案する。
論文 参考訳(メタデータ) (2021-09-26T11:27:12Z) - Physics-informed Neural Networks-based Model Predictive Control for
Multi-link Manipulators [0.0]
物理インフォームド機械学習手法を用いて,多体ダイナミクスに対する非線形モデル予測制御(NMPC)について論じる。
本稿では,ネットワーク入力として制御動作と初期条件を付加することでPINNの強化を提案する。
PINNベースのMPCを用いて,複雑な機械システムにおける追跡問題の解法を提案する。
論文 参考訳(メタデータ) (2021-09-22T15:31:24Z) - DAIS: Automatic Channel Pruning via Differentiable Annealing Indicator
Search [55.164053971213576]
畳み込みニューラルネットワークは,計算オーバーヘッドが大きいにもかかわらず,コンピュータビジョンタスクの実行において大きな成功を収めている。
構造的(チャネル)プルーニングは、通常、ネットワーク構造を保ちながらモデルの冗長性を低減するために適用される。
既存の構造化プルーニング法では、手作りのルールが必要であり、これは大きなプルーニング空間に繋がる可能性がある。
論文 参考訳(メタデータ) (2020-11-04T07:43:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。