論文の概要: Embedded Arena: Iterative Optimization via Hardware Feedback
- arxiv url: http://arxiv.org/abs/2606.16190v1
- Date: Mon, 15 Jun 2026 04:04:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 18:36:05.02227
- Title: Embedded Arena: Iterative Optimization via Hardware Feedback
- Title(参考訳): Embedded Arena: ハードウェアフィードバックによる反復最適化
- Authors: Zhihan Zhang, Alexander Le Metzger, Jiuyang Lyu, Chun-Cheng Chang, Jiayi Shao, Yujia Liu, Emmanuel Azuh Mensah, Edward Wang, Kurtis Heimerl, Gregory D. Abowd, Shwetak Patel, Natasha Jaques, Vikram Iyer,
- Abstract要約: エージェント共最適化は、精度が3.3%、オーディオが400倍、特徴誤差が6%の視覚モデルに対して250倍の圧縮を達成する。
Elk検出カメラトラップ(96.7%精度)と音声書き起こしウェアラブル(8.44%FER)の2つの実世界のシステムにおける実用的影響を実証する。
- 参考スコア(独自算出の注目度): 44.54626665766497
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Embedded devices from wildlife monitoring stations to clinical wearables require local AI inference due to latency, communication, or privacy constraints. Optimizing models for heterogeneous microcontrollers (MCUs) requires simultaneously satisfying hard physical constraints on memory, power, and temperature while preserving accuracy, a multidimensional optimization that is today performed manually by experts. We ask whether an LLM agent can autonomously navigate this complex, multi-turn pipeline guided by real hardware feedback, and introduce a hardware-in-the-loop agent arena in which the agent iteratively refines both model and firmware -- compiling, flashing, and measuring on real hardware -- to enable closed-loop optimization. Frontier models, including Claude Opus 4.7 and Gemini 3.1 Pro, fail entirely without hardware feedback (0% deployment success), whereas our hardware-in-the-loop formulation achieves the first successful deployment within three iterations and can surpass human expert results within seven. This agentic co-optimization achieves 250x compression for vision models with <3.3% accuracy loss and 400x for audio with <6% Feature Error Rate loss, enabling battery-free operation on a commercial MCU via solar harvesting. We demonstrate practical impact in two real-world systems: an elk-detection camera trap (96.7% accuracy) and a phonetic-transcription wearable (8.44% FER) for child development research.
- Abstract(参考訳): 野生生物の監視ステーションから臨床ウェアラブルへの組み込みデバイスは、レイテンシ、通信、プライバシの制約による局所的なAI推論を必要とする。
ヘテロジニアスマイクロコントローラ(MCU)の最適化モデルは、精度を維持しながらメモリ、電力、温度の厳しい物理的制約を同時に満たす必要がある。
LLMエージェントが、この複雑なマルチターンパイプラインを、実際のハードウェアフィードバックによって自律的にナビゲートできるかどうかを問うとともに、エージェントがモデルとファームウェア(コンパイル、フラッシュ、実ハードウェアでの計測)を反復的に洗練し、クローズドループ最適化を実現するハードウェア・イン・ザ・ループエージェント・アリーナを導入する。
Claude Opus 4.7やGemini 3.1 Proといったフロンティアモデルは、ハードウェアのフィードバックなしで完全に失敗する(デプロイ成功率は0%)。
このエージェントによる協調最適化は、精度が3.3%、オーディオが400倍、機能エラー率が6%で250倍の圧縮を実現し、太陽光収穫による商用MCUでのバッテリフリー運転を可能にした。
実世界の2つのシステムにおける実践的な影響を実証する: 児童発達研究のためのエレク検出カメラトラップ(96.7%の精度)と音声転写ウェアラブル(8.44%のFER)である。
関連論文リスト
- OpenGlass: Ultra-Low-Power On-Device AI Eyewear with Event-based Vision [8.93031966791759]
この研究は、新しいセンサーとアルゴリズムを迅速にプロトタイピングするためのオープンソースのスマートグラスプラットフォームを導入する。
モジュラーデザインはフレキシブルなFPCインターポーザを使用して、完全なPCBなしでイベントベースのカメラとフレームベースのカメラの両方をサポートする。
プロトタイプは200mAhのバッテリーで11.5時間連続したデバイス上でのMLを実現する。
論文 参考訳(メタデータ) (2026-06-05T16:27:02Z) - Deep Learning-Based Anomaly Detection in Spacecraft Telemetry on Edge Devices [0.038233569758620044]
本稿では,衛星テレメトリ異常検出のための3つのアプローチについて検討する。
欧州宇宙機関異常データセット上で,多目的ニューラルアーキテクチャ最適化を用いてエッジ配置に最適化する。
最適化されたモデルでは、CubeSat RAMのわずか0.36-6.25%しか必要とせず、高度に制約されたハードウェア上でも、オンボードの異常検出を実用的なものにしている。
論文 参考訳(メタデータ) (2026-03-31T07:45:40Z) - Lightweight Transformer Architectures for Edge Devices in Real-Time Applications [0.0]
本調査では,エッジデプロイメント用に設計された軽量トランスフォーマーアーキテクチャについて検討する。
我々は、MobileBERT、TinyBERT、DistilBERT、EfficientFormer、EdgeFormer、MobileViTなど、注目すべき軽量版を体系的にレビューした。
実験により, モデルサイズを4~10倍, 推論遅延を3~9倍削減し, モデル精度を75~96%向上できることを確認した。
論文 参考訳(メタデータ) (2026-01-05T01:04:25Z) - SD3.5-Flash: Distribution-Guided Distillation of Generative Flows [87.45964232927945]
SD3.5-Flashは、高画質の画像生成を消費者デバイスにもたらす、効率的な数ステップ蒸留フレームワークである。
グラデーションノイズを低減するための"タイムステップ共有"と、迅速なアライメントを改善するための"スプリットタイムステップ微調整"の2つの重要なイノベーションを紹介します。
これにより、携帯電話からデスクトップコンピュータまで、あらゆるデバイスへのアクセスが民主化される。
論文 参考訳(メタデータ) (2025-09-25T16:07:38Z) - EfficientLLM: Efficiency in Large Language Models [64.3537131208038]
大規模言語モデル(LLM)は大きな進歩を導いてきたが、その増加とコンテキストウィンドウは計算、エネルギー、金銭的コストを禁止している。
本稿では,新しいベンチマークであるEfficientLLMを紹介する。
論文 参考訳(メタデータ) (2025-05-20T02:27:08Z) - Hybrid Knowledge Transfer through Attention and Logit Distillation for On-Device Vision Systems in Agricultural IoT [0.0]
この研究は、精密農業におけるリアルタイムでエネルギー効率の高い作物モニタリングを推進している。
これは、エッジデバイス上でViTレベルの診断精度を実現する方法を示している。
論文 参考訳(メタデータ) (2025-04-21T06:56:41Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Data-Model-Circuit Tri-Design for Ultra-Light Video Intelligence on Edge
Devices [90.30316433184414]
本稿では,HDビデオストリーム上での高スループット,低コスト,高精度MOTのためのデータモデル・ハードウエア・トリデザイン・フレームワークを提案する。
現状のMOTベースラインと比較して、我々の三設計アプローチは12.5倍の遅延低減、20.9倍のフレームレート改善、5.83倍の低消費電力、9.78倍のエネルギー効率を実現でき、精度は低下しない。
論文 参考訳(メタデータ) (2022-10-16T16:21:40Z) - SensiX: A Platform for Collaborative Machine Learning on the Edge [69.1412199244903]
センサデータとセンサモデルの間に留まるパーソナルエッジプラットフォームであるSensiXを紹介する。
動作および音声に基づくマルチデバイスセンシングシステムの開発において,その有効性を示す。
評価の結果,SensiXは3mWのオーバヘッドを犠牲にして,全体の精度が7~13%向上し,環境のダイナミクスが最大30%向上することがわかった。
論文 参考訳(メタデータ) (2020-12-04T23:06:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。