論文の概要: AutoMCU: Feasibility-First MCU Neural Network Customization via LLM-based Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2605.21560v1
- Date: Wed, 20 May 2026 14:59:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:41.940889
- Title: AutoMCU: Feasibility-First MCU Neural Network Customization via LLM-based Multi-Agent Systems
- Title(参考訳): AutoMCU: LLMベースのマルチエージェントシステムによるフェーザビリティファーストMCUニューラルネットワークのカスタマイズ
- Authors: Penglin Dai, Zijie Zhou, Xincao Xu, Junhua Wang, Xiao Wu, Lixin Duan,
- Abstract要約: AutoMCUは、LLMベースの多エージェントシステムで、MCU制約下でのニューラルネットワークのカスタマイズを自動化する。
AutoMCUは、構造化アーキテクチャ候補を反復的に生成し、トレーニング前にベンダーツールチェーンフィードバックを通じて実現不可能な設計をフィルタリングし、制御されたプロトコルの下で実行可能なモデルを評価し、バックエンドの配置分析を通じてデプロイ可能性を検証する。
CIFAR-10とCIFAR-100の厳密なMCU制約下での実験では、AutoMCUは、カスタマイズ時間を約1~2時間に短縮しながら、競争精度を達成している。
- 参考スコア(独自算出の注目度): 31.364398184278148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying neural networks on microcontroller units (MCUs) is critical for edge intelligence but remains challenging due to tight memory, storage, and computation constraints. Existing approaches, such as model compression and hardware-aware neural architecture search (HW-NAS), often depend on proxy metrics, incur high search cost, and do not fully bridge the gap between architecture design and verified deployment. This paper presents AutoMCU, a feasibility-first large language model (LLM)-based multi-agent system for automated neural network customization under MCU constraints. Given natural-language task requirements and hardware specifications, AutoMCU iteratively generates structured architecture candidates, filters infeasible designs through vendor toolchain feedback before training, evaluates feasible models under a controlled protocol, and verifies deployability through backend-grounded deployment analysis. AutoMCU includes two key mechanisms: 1) hardware-in-the-loop architecture generation for early elimination of undeployable candidates under RAM and Flash constraints, and 2) state-isolated multi-agent scheduling for stable coordination of proposal, training, evaluation, and deployment stages. Experiments on CIFAR-10 and CIFAR-100 under strict MCU constraints show that AutoMCU achieves competitive accuracy while reducing customization time to about 1--2 hours, compared with hundreds of GPU hours for representative MCU-oriented HW-NAS baselines. Comparisons with ColabNAS and the LLM-based NAS method GENIUS on NAS-Bench-201 further demonstrate the effectiveness and stability of AutoMCU. Real-device deployments on multiple STM32 microcontrollers validate its practical applicability to MCU-scale edge intelligence.
- Abstract(参考訳): マイクロコントローラユニット(MCU)にニューラルネットワークをデプロイすることは、エッジインテリジェンスにとって重要だが、厳しいメモリ、ストレージ、計算の制約のため、依然として難しい。
モデル圧縮やハードウェア対応のニューラルアーキテクチャサーチ(HW-NAS)のような既存のアプローチは、しばしばプロキシメトリクスに依存し、高い検索コストを発生させる。
本稿では,MCU制約下でのニューラルネットワークの自動カスタマイズのための,LLMに基づく多エージェントシステムであるAutoMCUを提案する。
自然言語のタスク要件とハードウェア仕様を前提として、AutoMCUは構造化アーキテクチャ候補を反復的に生成し、トレーニング前にベンダーツールチェーンのフィードバックを通じて実現不可能な設計をフィルタし、制御されたプロトコルの下で実行可能なモデルを評価し、バックエンドの配置分析を通じてデプロイ可能性を検証する。
AutoMCUには2つの重要なメカニズムがある。
1)RAMおよびFlash制約下での非デプロイ候補の早期排除のためのハードウェア・イン・ザ・ループアーキテクチャ生成
2)提案,訓練,評価,展開段階の安定的な調整のための状態分離型マルチエージェントスケジューリング。
厳密なMCU制約下でのCIFAR-10とCIFAR-100の実験では、AutoMCUは、MCU指向のHW-NASベースラインの数百GPU時間と比較して、カスタマイズ時間を約1~2時間に短縮し、競争精度を達成している。
ColabNAS と LLM を用いた NAS 法 GENIUS のNAS-Bench-201 との比較により,AutoMCU の有効性と安定性が明らかにされた。
複数のSTM32マイクロコントローラ上の実デバイス展開は、MCUスケールエッジインテリジェンスへの適用性を検証する。
関連論文リスト
- Split CNN Inference on Networked Microcontrollers [13.922830929023783]
マイクロコントローラ(MCU)上のディープニューラルネットワークは、限られたメモリリソースによって厳しく制限されている。
TinyMLのテクニックは、推論中にRAM(Random Access Memory)の使用が過大なため、実際に失敗する。
本稿では,複数のデバイスにまたがる畳み込みニューラルネットワーク(CNN)モデルの協調推論を可能にする,ネットワーク型MCUのための細粒度分割推論システムを提案する。
論文 参考訳(メタデータ) (2026-05-10T06:16:11Z) - OneDrive: Unified Multi-Paradigm Driving with Vision-Language-Action Models [69.2503510410147]
予め訓練されたVLM上に構築した統合自動運転フレームワークを提案する。
トレーニング済みのVLMアテンションは、純粋言語モデリング以上の強い伝達性を示すことを示す。
エンドツーエンドの自動運転ベンチマークの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2026-04-20T07:50:00Z) - NanoCockpit: Performance-optimized Application Framework for AI-based Autonomous Nanorobotics [50.594459728605734]
小型のフォームファクタ、すなわち10sグラムは、計算資源をSI100ミリワット以下のマイクロコントローラユニット(MCU)に著しく制限する。
本フレームワークは,タスクのシリアライズによるオーバーヘッドをゼロにすることで,クローズドループ制御性能の定量的改善を実現する。
論文 参考訳(メタデータ) (2026-01-12T12:29:38Z) - MindWatcher: Toward Smarter Multimodal Tool-Integrated Reasoning [55.221850286246]
我々は、インターリーブド思考とマルチモーダル・チェーン・オブ・シークレット(CoT)推論を備えたツール統合推論エージェントであるMindWatcherを紹介する。
MindWatcherは、さまざまなツールの呼び出しと使用の調整を自律的に行うことができる。
車、動物、植物を含む8つのカテゴリをカバーする、大規模で高品質な局所画像検索データベースは、堅牢な物体認識モデルを提供する。
論文 参考訳(メタデータ) (2025-12-29T12:16:12Z) - InternBootcamp Technical Report: Boosting LLM Reasoning with Verifiable Task Scaling [71.37579508777843]
大規模言語モデル(LLM)は、複雑な推論機能を実現することによって、人工知能に革命をもたらした。
このギャップに対処するため、1000以上のドメイン分散タスク環境からなるオープンソースのフレームワークであるInternBootcampを紹介します。
論文 参考訳(メタデータ) (2025-08-12T05:00:00Z) - NNTile: a machine learning framework capable of training extremely large GPT language models on a single node [83.9328245724548]
NNTileはタスクベースの並列処理を実装したStarPUライブラリをベースとしている。
これは、大きなニューラルネットワークをトレーニングするために必要な特定の操作が、CPUコアまたはGPUデバイスのいずれかで実行されることを意味する。
論文 参考訳(メタデータ) (2025-04-17T16:22:32Z) - AutoHete: An Automatic and Efficient Heterogeneous Training System for LLMs [68.99086112477565]
トランスフォーマーベースの大規模言語モデル(LLM)は、シーケンスモデリングやテキスト生成において例外的な機能を示した。
既存の異種トレーニング手法は、トレーニング可能なモデルの規模を大幅に拡大するが、かなりの通信オーバーヘッドとCPUワークロードを導入している。
本稿では,シングルGPU環境とマルチGPU環境の両方に互換性のある,自動的で効率的なヘテロジニアストレーニングシステムであるAutoHeteを提案する。
論文 参考訳(メタデータ) (2025-02-27T14:46:22Z) - Accelerating TinyML Inference on Microcontrollers through Approximate Kernels [3.566060656925169]
本研究では、近似計算とソフトウェアカーネル設計を組み合わせることで、マイクロコントローラ上での近似CNNモデルの推定を高速化する。
CIFAR-10データセットでトレーニングされたSTM32-Nucleoボードと2つの人気のあるCNNによる評価は、最先端の正確な推測と比較すると、平均21%のレイテンシ削減が可能であることを示している。
論文 参考訳(メタデータ) (2024-09-25T11:10:33Z) - MONAS: Efficient Zero-Shot Neural Architecture Search for MCUs [5.321424657585365]
MONASは、エッジコンピューティングのマイクロコントローラ(MCU)用に特別に設計された、ゼロショットNASフレームワークである。
MONASは、MCUをターゲットとした以前の作業よりも1104倍の検索効率向上を実現している。
MONASは、より一般的なNASアプローチと同じような精度を維持しながら、MCUの3.23倍高速な推測でCNNモデルを発見することができる。
論文 参考訳(メタデータ) (2024-08-26T10:24:45Z) - MCU-MixQ: A HW/SW Co-optimized Mixed-precision Neural Network Design Framework for MCUs [9.719789698194154]
ニューラルネットワーク処理に十分なデータ幅を利用する混合精度ニューラルネットワーク(MPNN)は、厳密なリソース制約を満たすための効果的なアプローチである。
しかし、MCUクラスのISAにはサブバイトと混合精度のSIMD操作がない。
本研究では,複数の低ビット幅演算を単一の命令多重データ(SIMD)命令にパックする手法を提案する。
論文 参考訳(メタデータ) (2024-07-17T14:51:15Z) - MicroNAS: Memory and Latency Constrained Hardware-Aware Neural
Architecture Search for Time Series Classification on Microcontrollers [3.0723404270319685]
我々は、資源制約型マイクロコントローラ(MCU)における時系列分類問題を解決するために、差別化可能なニューラルネットワーク探索(DNAS)の概念を適用した。
ドメイン固有のHW-NASシステムであるMicroNASを導入し、DNAS、ルックアップテーブル、動的畳み込み、MCUの時系列分類に特化して設計された新しい検索空間を提案する。
異なるMCUと標準ベンチマークデータセットの研究により、MicroNASは、最先端のデスクトップモデルに近いパフォーマンス(F1スコア)を達成するMCUに適したアーキテクチャを見つけることを示した。
論文 参考訳(メタデータ) (2023-10-27T06:55:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。