論文の概要: CoSense-LLM: Semantics at the Edge with Cost- and Uncertainty-Aware Cloud-Edge Cooperation
- arxiv url: http://arxiv.org/abs/2510.19670v1
- Date: Wed, 22 Oct 2025 15:16:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.947897
- Title: CoSense-LLM: Semantics at the Edge with Cost- and Uncertainty-Aware Cloud-Edge Cooperation
- Title(参考訳): CoSense-LLM: コストと不確実性を考慮したエッジのセマンティックス
- Authors: Hasan Akgul, Mari Eplik, Javier Rojas, Aina Binti Abdullah, Pieter van der Merwe,
- Abstract要約: CoSense-LLMは、連続したマルチモーダルセンサストリームをコンパクトなセマンティックトークンに変換するエッジファーストフレームワークである。
システムは、ページ化またはストリーミングKVキャッシュ、Flashスタイルのカーネル、投機的復号化、量子化されたLoRAアダプタなど、モダンなサービス最適化で動作する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present CoSense-LLM, an edge-first framework that turns continuous multimodal sensor streams (for example Wi-Fi CSI, IMU, audio, RFID, and lightweight vision) into compact, verifiable semantic tokens and coordinates with large language models under explicit latency, energy, bandwidth, and privacy constraints. CoSense-LLM has four parts: (i) SenseFusion, a lightweight encoder that aligns sensor embeddings with language and compresses them into short discrete code sequences; (ii) Edge-RAG, a local hybrid retrieval layer that grounds generation in site specific policies and notes; (iii) PromptRouter, a cost and uncertainty aware policy that selects edge only generation, edge plus retrieval, or compact cloud escalation; and (iv) Secure Execution, an auditable redaction path that enforces data minimization so raw waveforms never leave the device. The system works with modern serving optimizations, including paged or streaming KV caches, FlashAttention style kernels, speculative decoding, and quantized LoRA adapters, and supports on device personalization and federated updates under non IID drift. Across home, office, and clinic deployments, CoSense-LLM delivers grounded explanations while meeting tight service level objectives: it sustains sub second (p95) end to end latency on edge dominant paths, reduces inter tier token and bandwidth costs by preferring local retrieval grounded responses, and preserves privacy by transmitting only discrete codes and redacted metadata. Ablations show that Edge-RAG improves factual consistency and reduces contradictions, calibrated uncertainty enables selective abstention and controlled escalations, and KV plus decoding accelerators lower energy per decision. The results support an edge first design that treats semantics, privacy, and predictable latency as co equal goals for large model deployments in interference prone environments.
- Abstract(参考訳): 我々は、連続したマルチモーダルセンサストリーム(Wi-Fi CSI、IMU、オーディオ、RFID、軽量ビジョン)をコンパクトで検証可能なセマンティックトークンに変換し、明示的なレイテンシ、エネルギ、帯域幅、プライバシ制約の下で大規模言語モデルとのコーディネートに変換するエッジファーストフレームワークであるCoSense-LLMを提案する。
CoSense-LLM には4つの部分がある。
(i)SenseFusionは,センサ埋め込みを言語に合わせる軽量エンコーダで,短い離散コードシーケンスに圧縮する。
(ii)エッジRAG(サイト特定ポリシー及びノートの生成を基盤としたローカルハイブリッド検索層)
3 PromptRouterは、エッジのみの生成、エッジ+検索又はコンパクトクラウドエスカレーションを選択する費用及び不確実性を意識した政策
(iv)セキュア実行(Secure Execution)は、データ最小化を強制する監査可能なリアクションパスであり、生波形がデバイスを離れることはない。
このシステムは、ページ化されたKVキャッシュやストリーミングKVキャッシュ、FlashAttentionスタイルのカーネル、投機的デコーディング、量子化されたLoRAアダプタなど、現代的なサービス最適化で動作し、デバイスパーソナライズと非IDドリフトによるフェデレーション更新をサポートする。
ホーム、オフィス、クリニックのデプロイメント全体にわたって、CoSense-LLMは、厳密なサービスレベルの目標を満たしながら、基盤化された説明を提供する。エッジ支配的なパスにおいて、サブ秒(p95)の終端レイテンシを持続し、ローカル検索の接地応答を優先することで、層間トークンと帯域幅コストを削減し、個別コードとメタデータのみを送信することでプライバシを保存する。
アブレーションは、Edge-RAGが事実整合性を改善し、矛盾を減らすことを示し、キャリブレーションされた不確実性は選択的棄権と制御されたエスカレーションを可能にし、KV+復号化加速器は決定毎に低いエネルギーを消費することを示している。
結果はエッジファーストの設計をサポートし、セマンティクス、プライバシ、予測可能なレイテンシを、干渉しがちな環境における大規模なモデルデプロイメントの同じ目標として扱う。
関連論文リスト
- Federated Spatiotemporal Graph Learning for Passive Attack Detection in Smart Grids [2.721477719641864]
本稿では,時間的ウィンドウ上で物理層と行動指標を融合させて受動的攻撃を検出するグラフ中心型マルチモーダル検出器を提案する。
テスト精度は98.32%、シーケンス毎の93.35%を0.15% FPRで達成している。
論文 参考訳(メタデータ) (2025-09-29T08:52:30Z) - Adaptive Learning for IRS-Assisted Wireless Networks: Securing Opportunistic Communications Against Byzantine Eavesdroppers [7.256056777973974]
ビザンチン耐性スペクトルセンシングとセキュアインテリジェント反射面(IRS)のための共同学習フレームワークを提案する。
本研究では,局所曲率の緩やかな速度で,予測更新と証明可能なサブ線形収束を提供する拡張ラグランジアン交互化アルゴリズムを開発した。
多様なネットワーク条件のシミュレーションでは、敵攻撃時の固定偽アラームレートの検出確率が高く、正直なユーザに対する総和MSEの大幅な削減、盗聴信号の強い抑制、高速収束が示される。
論文 参考訳(メタデータ) (2025-08-11T17:28:25Z) - SLED: A Speculative LLM Decoding Framework for Efficient Edge Serving [7.91607650966469]
acronymは、軽量エッジデバイスが様々なドラフトモデルを使用して、複数の候補トークンをローカルにドラフトできるフレームワークである。
単一の共有エッジサーバは、より正確なターゲットモデルを用いてトークンを検証する。
Jetson Orin Nano、Raspberry Pi 4B/5、Nvidia A100 GPUを搭載したエッジサーバを使った最初の実験は、大きなメリットを示している。
論文 参考訳(メタデータ) (2025-06-11T04:55:54Z) - PWC-MoE: Privacy-Aware Wireless Collaborative Mixture of Experts [59.5243730853157]
クラウドサーバにホストされる大規模言語モデル(LLM)は、ローカルデバイス上の計算とストレージの負担を軽減するが、プライバシの懸念を高める。
小規模言語モデル(SLM)は、ローカルで実行されるためプライバシーが向上するが、複雑なタスクではパフォーマンスが制限される。
帯域幅制約下での計算コスト,性能,プライバシ保護のバランスをとるために,プライバシを意識したPWC-MoE(PWC-MoE)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:27:07Z) - DiffCom: Decoupled Sparse Priors Guided Diffusion Compression for Point Clouds [54.96190721255167]
ロスシー圧縮は、ポイントクラウドをストレージの潜在ポイントに変換するためのオートエンコーダに依存している。
本稿では,特に低レベルにおいて高い復元品質を実現するための拡散型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-21T05:41:35Z) - Collaborative Automatic Modulation Classification via Deep Edge Inference for Hierarchical Cognitive Radio Networks [19.303303020775555]
階層的認知無線ネットワークでは、エッジまたはクラウドサーバは、エッジデバイスが収集したデータを変調分類に利用する。
本稿では、エッジデバイスとインテリジェントな共推論のためのエッジサーバを共同で動員するエッジ学習(EL)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-12T11:14:25Z) - Over-the-Air Federated Learning with Privacy Protection via Correlated
Additive Perturbations [57.20885629270732]
我々は、複数のユーザ/エージェントからエッジサーバへの勾配更新をOtA(Over-the-Air)で送信することで、無線フェデレーション学習のプライバシー面を考察する。
従来の摂動に基づく手法は、トレーニングの精度を犠牲にしてプライバシー保護を提供する。
本研究では,エッジサーバにおけるプライバシリークの最小化とモデル精度の低下を目標とする。
論文 参考訳(メタデータ) (2022-10-05T13:13:35Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - FCOS: A simple and strong anchor-free object detector [111.87691210818194]
物体検出を画素ごとの予測方式で解くために, 完全畳み込み型一段物検出器 (FCOS) を提案する。
RetinaNet、SSD、YOLOv3、Faster R-CNNといった最先端のオブジェクト検出器のほとんどは、事前に定義されたアンカーボックスに依存している。
対照的に、提案した検出器FCOSはアンカーボックスフリーであり、提案はフリーである。
論文 参考訳(メタデータ) (2020-06-14T01:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。