論文の概要: CABLE: Cloud-Assisted Bandwidth-efficient LMM-based Encoding for V2X Systems
- arxiv url: http://arxiv.org/abs/2606.19258v1
- Date: Wed, 17 Jun 2026 16:35:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.27299
- Title: CABLE: Cloud-Assisted Bandwidth-efficient LMM-based Encoding for V2X Systems
- Title(参考訳): CABLE:V2Xシステムのためのクラウド支援帯域効率LMMベースの符号化
- Authors: Haohua Que, Zhipeng Bao, Qianyi Wu, Handong Yao,
- Abstract要約: CABLEは、エッジクラウド認識のための、クラウド支援帯域幅効率のLMMベースの符号化フレームワークである。
5つのデータセットに対する実験は、ほぼ知覚を保ちながら一貫したコミュニケーションの節約を示す。
- 参考スコア(独自算出の注目度): 15.077749911540034
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cloud-hosted large multimodal models (LMMs) can provide strong open-vocabulary perception for Vehicle-to-Everything systems, but naively transmitting full-resolution frames from edge to cloud causes severe communication overhead and high cloud-side prefill latency. We present CABLE, a cloud-assisted bandwidth-efficient LMM-based encoding framework for edge-cloud perception. CABLE propagates the previous cloud segmentation mask on the edge using ego-motion compensation, refines it with residual-motion cues, and consolidates disconnected regions via a corridor envelope to form a robust region of interest (ROI). Only ROI-masked images are uploaded, while the cloud segmentation output is fed back as the prior for the next frame, forming a mask-to-ROI-to-LMM feedback loop. Experiments on five datasets (nuScenes, WOD-ZB, Waymo, KITTI, and CADC) show consistent communication savings while largely preserving perception, achieving $73$--$87\%$ ROI pixel-coverage reduction with $5$--$8\times$ estimated LMM prefill speedup at a modest detection-quality trade-off relative to full-frame inference.
- Abstract(参考訳): クラウドホスト型大規模マルチモーダルモデル(LMM)は、車両間通信システムに対して強力なオープンボキャブラリ認識を提供するが、エッジからクラウドへの完全な解像度のフレームの送出は、通信オーバーヘッドの深刻化とクラウド側のプリフィル遅延の増大を引き起こす。
我々は、エッジクラウド認識のための、クラウド支援帯域幅効率のLMMベースの符号化フレームワークであるCABLEを提案する。
CABLEは、エゴモーション補償を用いてエッジ上の前の雲のセグメンテーションマスクを伝搬し、それを残留モーションキューで洗練し、廊下のエンベロープを介して非連結領域を統合して、堅牢な関心領域(ROI)を形成する。
ROIマインドされたイメージのみがアップロードされ、クラウドセグメンテーション出力が次のフレームの先頭として返され、マスクからROI-to-LMMフィードバックループを形成する。
5つのデータセット(nuScenes, WOD-ZB, Waymo, KITTI, CADC)に対する実験では、認識を保ちながら、一貫した通信の節約を示し、フルフレーム推論と比較してわずかに検出品質のトレードオフで、53$--$87\%のROIピクセル被覆率を5$--$8\times$推定LMMプリフィルスピードアップで達成している。
関連論文リスト
- Fast-dVLM: Efficient Block-Diffusion VLM via Direct Conversion from Autoregressive VLM [58.322826487307765]
我々は,KV-cache互換並列デコードと推測ブロックデコードが可能なブロック拡散型VLMであるFast-dVLMを提案する。
SGLangの統合とFP8量子化により、Fast-dVLMはARベースライン上でのエンドツーエンドの推論速度を6倍以上に向上する。
論文 参考訳(メタデータ) (2026-04-08T08:50:08Z) - R2E-VID: Two-Stage Robust Routing via Temporal Gating for Elastic Edge-Cloud Video Inference [15.625229432769892]
R2E-VIDは2段階のロバストなルーティングフレームワークである。
R2E-VIDは、クラウド中心のベースラインと比較して、全体のコストを最大60%から60%削減する。
最先端のエッジクラウドソリューションよりも,推論精度を2~7%向上しながら,35~45%の遅延時間を実現している。
論文 参考訳(メタデータ) (2026-04-03T10:04:45Z) - LiNeXt: Revisiting LiDAR Completion with Efficient Non-Diffusion Architectures [52.59993476989728]
LiNeXtは、高速で正確なポイントクラウド補完に最適化された軽量で非拡散ネットワークである。
LiNeXtは推論の199.8倍の高速化を実現し、チャンファー距離を50.7%削減し、LiDiffと比較してパラメータの6.1%しか使用していない。
論文 参考訳(メタデータ) (2025-11-13T11:28:18Z) - EC-Diff: Fast and High-Quality Edge-Cloud Collaborative Inference for Diffusion Models [57.059991285047296]
高速な推論と高品質な生成を実現するために,ハイブリッドエッジクラウドコラボレーションフレームワークが最近提案されている。
過度の雲が推論時間を延ばす一方、不十分なステップは意味的な曖昧さを引き起こし、エッジモデルの出力の不整合を引き起こす。
勾配に基づく雑音推定により雲の推測を高速化するEC-Diffを提案する。
提案手法は, エッジ推定に比べて生成品質を著しく向上する一方で, クラウド推定に比べて平均2倍の速度アップを達成できる。
論文 参考訳(メタデータ) (2025-07-16T07:23:14Z) - Fast and Cost-effective Speculative Edge-Cloud Decoding with Early Exits [11.398891065175686]
大型言語モデル(LLM)は、スマートフォン、ウェアラブル、エンボディロボットなどのエッジデバイス上の様々なアプリケーションを可能にする。
LLMはデバイス上でデプロイ可能で、レイテンシを低減し、プライバシを改善したコスト効率の高いソリューションを提供する。
本稿では,サーバ上での大きなターゲットモデルとデバイス上での小さなドラフトモデルを備えた,高速で費用対効果の高いエッジクラウドデコーディングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-27T14:55:16Z) - When Cloud Removal Meets Diffusion Model in Remote Sensing [4.824120664293887]
リモートセンシング画像における雲除去のための新しいフレームワークであるDC4CR(Diffusion Control for Cloud removal)を提案する。
提案手法では, 予め生成した雲面に頼らずに, 薄い雲と厚い雲を選択的に除去できるプロンプト駆動制御を導入する。
RICEとCUHK-CRデータセットの実験では、最先端のパフォーマンスを示し、さまざまな条件で優れたクラウド除去を実現している。
論文 参考訳(メタデータ) (2025-04-21T00:56:57Z) - Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [54.53508601749513]
本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバーヘッドを最大52%削減し,システム遅延を最大63%削減できることがわかった。
論文 参考訳(メタデータ) (2025-03-17T08:37:22Z) - CE-CoLLM: Efficient and Adaptive Large Language Models Through Cloud-Edge Collaboration [1.6021932740447968]
大型言語モデル(LLM)は、人間のような優れた予測能力を示す。
LLMをデプロイして、エッジで効率的かつ適応的な推論サービスを提供するのは難しい。
本稿では,これらの課題に対処するために,LLM(CE-CoLLM)のための新しいクラウドエッジコラボレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T06:00:27Z) - IDF-CR: Iterative Diffusion Process for Divide-and-Conquer Cloud Removal in Remote-sensing Images [55.40601468843028]
雲除去のための反復拡散過程(IDF-CR)を提案する。
IDF-CRは、ピクセル空間と潜在空間に対処する2段階のモデルに分けられる。
潜時空間の段階では、拡散モデルは低品質の雲の除去を高品質のクリーンな出力に変換する。
論文 参考訳(メタデータ) (2024-03-18T15:23:48Z) - PMAA: A Progressive Multi-scale Attention Autoencoder Model for
High-performance Cloud Removal from Multi-temporal Satellite Imagery [26.694734522423797]
本研究では,PMAA(Progressive Multi-scale Attention Autoencoder)と呼ばれる高性能クラウド除去アーキテクチャを提案する。
PMAAはグローバルおよびローカル情報を利用して、新しいマルチスケールアテンションモジュール(MAM)と新しいローカルインタラクションモジュール(LIM)を使用して、堅牢なコンテキスト依存を構築する
PMAAは、以前の最先端モデルCTGANを2つのベンチマークデータセットで一貫して上回っている。
論文 参考訳(メタデータ) (2023-03-29T09:47:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。