論文の概要: MiCU: End-to-End Smart Home Command Understanding with Large Language Model
- arxiv url: http://arxiv.org/abs/2606.01099v1
- Date: Sun, 31 May 2026 08:40:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.205062
- Title: MiCU: End-to-End Smart Home Command Understanding with Large Language Model
- Title(参考訳): MiCU: 大規模言語モデルによるエンド・ツー・エンドのスマートホームコマンド理解
- Authors: Haowei Han, Kexin Hu, Weiwei Cai, Debiao Zhang, Bin Qin, Yuxiang Wang, Jiawei Jiang, Xiao Yan, Bo Du,
- Abstract要約: 大規模言語モデル(LLM)は、様々な領域にわたってよく一般化されている。
LLMはそのようなタスクにおいて従来のルールベースのシステムよりも優れているが、ドメイン固有のデータが少ないため、その効果は制限されることが多い。
コマンド理解に優れたドメイン固有のLLMであるMiCUを構築している。
- 参考スコア(独自算出の注目度): 41.633898350494256
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Command understanding systems in smart home ecosystems can automate device control and substantially improve user experience. However, while they perform well on precise utterances (e.g., "turn on the bedroom light"), they struggle with ambiguous or misaligned commands (e.g., "make the bedroom cozy"). Large language models (LLMs) generalize well across various domains and can outperform traditional rule-based systems on such tasks, but their effectiveness is often constrained by scarce domain-specific data, insufficient task-specific adaptation, and high computational costs. In this paper, we propose an automated training data synthesis workflow using user logs and LLMs; then we build MiCU, a domain-specific LLM that excels at command understanding. Specifically, we employ curriculum learning to inject domain knowledge into the base LLM, then we enhance its reasoning ability via cold-start training combined with reinforcement learning (RL) guided by domain-specific thinking rules. Additionally, we introduce a token compression technique that condenses device description into a single special token, substantially reducing inference overhead and enabling \model-fast, an efficient variant optimized for long inputs. Extensive experiments show that MiCU significantly outperforms baselines, with an average accuracy gain of 20.01% across all device categories. We have deployed MiCU in the Xiaomi Home app, receiving approximately 1.7 million page views per day. Production evaluations show that MiCU reduces user correction rate by 1.57% and increases human audited accuracy by 32.05%. Our data and code are available at https://github.com/xiaomi-research/iot_spec_llm
- Abstract(参考訳): スマートホームエコシステムにおけるコマンド理解システムは、デバイス制御を自動化し、ユーザエクスペリエンスを大幅に改善することができる。
しかし、正確な発話(例:「寝室の光を返す」)でうまく機能する一方で、曖昧さや不一致なコマンド(例:「寝室のコジ」)で苦労する。
大規模言語モデル(LLM)は、様々な領域でよく一般化され、そのようなタスクにおいて従来のルールベースのシステムよりも優れているが、その効果はドメイン固有のデータが少ないこと、タスク固有の適応が不十分であること、高い計算コストによって制約されることが多い。
本稿では,ユーザログとLLMを用いた自動トレーニングデータ合成ワークフローを提案する。
具体的には、基礎となるLLMにドメイン知識を注入するためにカリキュラム学習を使用し、ドメイン固有の思考規則によって指導された強化学習(RL)と冷間開始訓練による推論能力を向上させる。
さらに,1つの特別なトークンにデバイス記述を凝縮するトークン圧縮手法を導入し,推論オーバーヘッドを大幅に低減し,長い入力に最適化された効率的なモデルファストを実現する。
大規模な実験により、MiCUはすべてのデバイスカテゴリで平均精度が20.01%向上し、ベースラインを著しく上回ることが示された。
私たちはXiaomi HomeアプリにMiCUをデプロイし、1日あたり約170万ページビューを受け取りました。
生産評価の結果、MiCUはユーザの修正率を1.57%削減し、人間の監査精度を32.05%向上させた。
私たちのデータとコードはhttps://github.com/xiaomi-research/iot_spec_llmで公開されています。
関連論文リスト
- AutoMCU: Feasibility-First MCU Neural Network Customization via LLM-based Multi-Agent Systems [31.364398184278148]
AutoMCUは、LLMベースの多エージェントシステムで、MCU制約下でのニューラルネットワークのカスタマイズを自動化する。
AutoMCUは、構造化アーキテクチャ候補を反復的に生成し、トレーニング前にベンダーツールチェーンフィードバックを通じて実現不可能な設計をフィルタリングし、制御されたプロトコルの下で実行可能なモデルを評価し、バックエンドの配置分析を通じてデプロイ可能性を検証する。
CIFAR-10とCIFAR-100の厳密なMCU制約下での実験では、AutoMCUは、カスタマイズ時間を約1~2時間に短縮しながら、競争精度を達成している。
論文 参考訳(メタデータ) (2026-05-20T14:59:17Z) - MeKi: Memory-based Expert Knowledge Injection for Efficient LLM Scaling [29.784396745475835]
大規模言語モデル(LLM)のスケーリングは通常、パフォーマンスを高めるためにパラメータやテスト時間計算の数を増やすことに依存する。
MeKi(メモリベースエキスパートナレッジインジェクション)は、FLOPではなくストレージ空間を介してLLM容量をスケールする新しいシステムである。
MeKiは、同一の推論速度で高密度LLMベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-03T10:32:04Z) - NanoCockpit: Performance-optimized Application Framework for AI-based Autonomous Nanorobotics [50.594459728605734]
小型のフォームファクタ、すなわち10sグラムは、計算資源をSI100ミリワット以下のマイクロコントローラユニット(MCU)に著しく制限する。
本フレームワークは,タスクのシリアライズによるオーバーヘッドをゼロにすることで,クローズドループ制御性能の定量的改善を実現する。
論文 参考訳(メタデータ) (2026-01-12T12:29:38Z) - What Layers When: Learning to Skip Compute in LLMs with Residual Gates [66.23658560048241]
GateSkipは、デコーダのみのLMにおけるトークンワイド層スキップを可能にする残差ストリームゲーティング機構である。
各Attention/MLPブランチは、残ストリームに再入力する前に、ブランチの出力を凝縮するシグモイドリニアゲートを備えている。
論文 参考訳(メタデータ) (2025-10-13T16:31:50Z) - Accelerating TinyML Inference on Microcontrollers through Approximate Kernels [3.566060656925169]
本研究では、近似計算とソフトウェアカーネル設計を組み合わせることで、マイクロコントローラ上での近似CNNモデルの推定を高速化する。
CIFAR-10データセットでトレーニングされたSTM32-Nucleoボードと2つの人気のあるCNNによる評価は、最先端の正確な推測と比較すると、平均21%のレイテンシ削減が可能であることを示している。
論文 参考訳(メタデータ) (2024-09-25T11:10:33Z) - IGOT: Information Gain Optimized Tokenizer on Domain Adaptive Pretraining [2.009700777745832]
事前訓練されたLarge Language Models (LLM) は、自然言語生成の様々な分野で強力な能力を示している。
生成AIを使用して下流タスクを処理する場合、一般的なアプローチは、継続的なトレーニングや微調整を通じて新しい知識を追加することである。
本稿では、下流タスクの特殊トークンセットを分析し、特殊トークンと情報ゲインを併用した$phi$を用いて新しいサブセットを構築する情報ゲイン最適化トークンライザ(IGOT)を提案する。
ドメイン適応型事前学習におけるカスタマイズトークン化器の多くの効果について検討し,本手法がより優れた性能を発揮することを検証した。
論文 参考訳(メタデータ) (2024-05-16T07:25:10Z) - CPM-2: Large-scale Cost-effective Pre-trained Language Models [71.59893315671997]
本稿では, PLM を用いた事前学習, 微調整, 推論の効率性問題に対処するための費用対効果技術について述べる。
我々は,既存のPLMをスクラッチからトレーニングする代わりに活用することで,事前学習プロセスの促進を目的とした知識継承を導入する。
計算資源が限られている大規模PLMに対して,新しい推論ツールキット,すなわちInfMoEを実装した。
論文 参考訳(メタデータ) (2021-06-20T15:43:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。