論文の概要: IoT-Brain: Grounding LLMs for Semantic-Spatial Sensor Scheduling
- arxiv url: http://arxiv.org/abs/2604.08033v1
- Date: Thu, 09 Apr 2026 09:38:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.844088
- Title: IoT-Brain: Grounding LLMs for Semantic-Spatial Sensor Scheduling
- Title(参考訳): IoT-Brain: 意味空間センサスケジューリングのためのグラウンドディングLLM
- Authors: Zhaomeng Zhou, Lan Zhang, Junyang Wang, Mu Yuan, Junda Lin, Jinke Song,
- Abstract要約: IoT-Brainは、前例のない信頼性と効率で物理世界と対話するフレームワークである。
我々は、IoT-Brainが最強の検索集約手法よりもタスク成功率を37.6%向上させることを示した。
実際のデプロイメントでは、信頼性の高い上限に近づき、ネットワーク帯域幅を4.1倍削減する。
- 参考スコア(独自算出の注目度): 9.212512544511576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intelligent systems powered by large-scale sensor networks are shifting from predefined monitoring to intent-driven operation, revealing a critical Semantic-to-Physical Mapping Gap. While large language models (LLMs) excel at semantic understanding, existing perception-centric pipelines operate retrospectively, overlooking the fundamental decision of what to sense and when. We formalize this proactive decision as Semantic-Spatial Sensor Scheduling (S3) and demonstrate that direct LLM planning is unreliable due to inherent gaps in representation, reasoning, and optimization. To bridge these gaps, we introduce the Spatial Trajectory Graph (STG), a neuro-symbolic paradigm governed by a verify-before-commit discipline that transforms open-ended planning into a verifiable graph optimization problem. Based on STG, we implement IoT-Brain, a concrete system embodiment, and construct TopoSense-Bench, a campus-scale benchmark with 5,250 natural-language queries across 2,510 cameras. Evaluations show that IoT-Brain boosts task success rate by 37.6% over the strongest search-intensive methods while running nearly 2 times faster and using 6.6 times fewer prompt tokens. In real-world deployment, it approaches the reliability upper bound while reducing 4.1 times network bandwidth, providing a foundational framework for LLMs to interact with the physical world with unprecedented reliability and efficiency.
- Abstract(参考訳): 大規模センサネットワークを利用したインテリジェントシステムは、事前に定義された監視から意図駆動的な運用へとシフトし、重要なセマンティックから物理マッピングギャップを明らかにしている。
大きな言語モデル(LLM)はセマンティック理解に優れていますが、既存の知覚中心のパイプラインは振り返りを行ない、何を感じ、いつどのようにするかという根本的な決定を見越しています。
本稿では,この積極的決定を意味空間センサスケジューリング (S3) として定式化し,表現,推論,最適化に固有のギャップがあるため,直接LLM計画が信頼できないことを示す。
これらのギャップを埋めるために、我々は、オープンエンドプランニングを検証可能なグラフ最適化問題に変換する検証前コミットの規律によって支配されるニューロシンボリックパラダイムであるSpatial Trajectory Graph (STG)を導入する。
STGに基づいて、具体的なシステム実装であるIoT-Brainを実装し、2,510台のカメラで5,250の自然言語クエリを備えたキャンパススケールのベンチマークであるTopoSense-Benchを構築した。
評価によると、IoT-Brainは、最強の検索集約メソッドよりもタスク成功率を37.6%向上し、ほぼ2倍高速で6.6倍のプロンプトトークンを使用する。
現実世界のデプロイメントでは、信頼性の上限に近づき、4.1倍のネットワーク帯域幅を削減し、LCMが前例のない信頼性と効率で物理世界と対話するための基盤となるフレームワークを提供する。
関連論文リスト
- Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control [86.63490309209378]
我々は、最適制御として推論を定式化し、推論時に潜在状態に対して有限水平LQR計画を行うテスト時間制御層を導入する。
アーキテクチャ層として最適制御を組み込むことは、テスト時間トレーニングを超えた推論のための効果的でスケーラブルなメカニズムを提供することを実証する。
論文 参考訳(メタデータ) (2026-03-10T05:42:13Z) - STReasoner: Empowering LLMs for Spatio-Temporal Reasoning in Time Series via Spatial-Aware Reinforcement Learning [16.11676643415448]
時系列における時空間推論には、時間力学、空間依存、テキストコンテキストの明示的な合成が含まれる。
この能力は、交通ネットワークや電力網、病気の伝播といったシステムにおける高い意思決定に不可欠である。
このギャップに対処するために、エチオロジー推論、エンティティ識別、相関推論、コンテキスト内予測を含む4つのコアタスクからなるベンチマークであるST-Benchを導入する。
次に,STReasonerを提案し,LLMが時系列,グラフ構造,テキストを明示的な推論のために統合できるようにする。
論文 参考訳(メタデータ) (2026-01-06T18:46:12Z) - Think Fast: Real-Time IoT Intrusion Reasoning Using IDS and LLMs at the Edge Gateway [5.541753997410371]
本稿では、軽量機械学習(ML)ベースのIDSモデルと事前学習された大規模言語モデル(LLM)を統合したエッジ中心の侵入検知システム(IDS)について述べる。
このシステムは、決定木(DT)、K-Nearest Neighbors(KNN)、ランダムフォレスト(RF)、畳み込みニューラルネットワーク(CNN)、Long Short-Term Memory(LSTM)、低消費電力エッジゲートウェイ上のハイブリッドCNN-LSTMモデルの6つのMLベースIDSモデルを評価する。
異常検出のために、システムは低帯域APIコールを介してコンパクトでセキュアなテレメトリスナップショットをLSMに送信する。
論文 参考訳(メタデータ) (2025-11-23T00:33:51Z) - LIFT: Automating Symbolic Execution Optimization with Large Language Models for AI Networks [31.69036961288122]
LIFT(Large- Language-model Integrated Functional-equivalent-IR Transformation)は、シンボル実行における中間表現(IR)の最適化を自動化する新しいフレームワークである。
実世界のバイナリの実験では、パフォーマンスが大幅に向上した。
論文 参考訳(メタデータ) (2025-07-07T12:26:56Z) - ThinkGeo: Evaluating Tool-Augmented Agents for Remote Sensing Tasks [64.86209459039313]
ThinkGeoは、構造化ツールの使用とマルチステップ計画を通じて、リモートセンシングタスクにおけるツール拡張エージェントを評価するために設計されたエージェントベンチマークである。
我々はReActスタイルの対話ループを実装し,486 個の構造化エージェントタスク上でのオープンソース LLM とクローズドソース LLM の両方を1,773 個の専門家が検証した推論ステップで評価する。
分析の結果、ツールの精度とモデル間の計画整合性に顕著な相違が明らかになった。
論文 参考訳(メタデータ) (2025-05-29T17:59:38Z) - Benchmarking LLMs' Swarm intelligence [51.648605206159125]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - General-Purpose Aerial Intelligent Agents Empowered by Large Language Models [9.603293922137965]
本稿では,オープンワールドタスク実行が可能な,初の航空知的エージェントを提案する。
私たちのハードウェアとソフトウェアの共同設計システムは、2つの基本的な制限に対処します。
本システムは,コミュニケーション制約のある環境におけるタスク計画とシーン理解の信頼性を示す。
論文 参考訳(メタデータ) (2025-03-11T11:13:58Z) - Cognitive TransFuser: Semantics-guided Transformer-based Sensor Fusion
for Improved Waypoint Prediction [38.971222477695214]
RGB-LIDARベースのマルチタスク機能融合ネットワークであるCognitive TransFuserは、安全で完全な道路ナビゲーションのために、ベースラインネットワークを大幅に拡張し、超える。
提案したネットワークをCown05 Short と Town05 Long Benchmarkで広範囲な実験により検証し,44.2 FPSのリアルタイム推論時間を実現した。
論文 参考訳(メタデータ) (2023-08-04T03:59:10Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。