論文の概要: Bandwidth-adaptive Cloud-Assisted 360-Degree 3D Perception for Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2602.23871v1
- Date: Fri, 27 Feb 2026 10:12:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.363488
- Title: Bandwidth-adaptive Cloud-Assisted 360-Degree 3D Perception for Autonomous Vehicles
- Title(参考訳): 帯域適応型クラウド支援による自動運転車の360度3次元知覚
- Authors: Faisal Hawladera, Rui Meireles, Gamal Elghazaly, Ana Aguiar, Raphaël Frank,
- Abstract要約: 自動運転の鍵となる課題は、厳しいレイテンシの制約の下で、周囲の障害物に関するリアルタイムな状況認識を維持することである。
本稿では,V2X通信を利用して部分的にクラウドに処理をオフロードする手法を提案する。
提案手法では,トランスフォーマーモデルを用いて,マルチカメラセンサデータを総合的なBird's-Eye View(BEV)表現に融合する。
- 参考スコア(独自算出の注目度): 0.7557499794873328
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A key challenge for autonomous driving lies in maintaining real-time situational awareness regarding surrounding obstacles under strict latency constraints. The high processing requirements coupled with limited onboard computational resources can cause delay issues, particularly in complex urban settings. To address this, we propose leveraging Vehicle-to-Everything (V2X) communication to partially offload processing to the cloud, where compute resources are abundant, thus reducing overall latency. Our approach utilizes transformer-based models to fuse multi-camera sensor data into a comprehensive Bird's-Eye View (BEV) representation, enabling accurate 360-degree 3D object detection. The computation is dynamically split between the vehicle and the cloud based on the number of layers processed locally and the quantization level of the features. To further reduce network load, we apply feature vector clipping and compression prior to transmission. In a real-world experimental evaluation, our hybrid strategy achieved a 72 \% reduction in end-to-end latency compared to a traditional onboard solution. To adapt to fluctuating network conditions, we introduce a dynamic optimization algorithm that selects the split point and quantization level to maximize detection accuracy while satisfying real-time latency constraints. Trace-based evaluation under realistic bandwidth variability shows that this adaptive approach improves accuracy by up to 20 \% over static parameterization with the same latency performance.
- Abstract(参考訳): 自動運転の重要な課題は、厳格なレイテンシ制約の下で、周囲の障害物に関するリアルタイムな状況認識を維持することである。
高処理要求と限られた計算資源が組み合わさると、特に複雑な都市環境では遅延問題が発生する。
これを解決するために、我々はV2X通信を利用して、計算資源が豊富であるクラウドに部分的に処理をオフロードし、全体のレイテンシを低減することを提案する。
提案手法では,トランスフォーマーモデルを用いて,マルチカメラセンサデータを総合的なBird's-Eye View(BEV)表現に融合し,正確な360度3Dオブジェクト検出を実現する。
計算は、局所的に処理されるレイヤの数と特徴の量子化レベルに基づいて、車両とクラウドの間で動的に分割される。
ネットワーク負荷をさらに軽減するため,伝送前の特徴ベクトルのクリッピングと圧縮を適用した。
実世界の実験評価では,従来のオンボードソリューションに比べて,エンド・ツー・エンドのレイテンシが72パーセント削減された。
変動するネットワーク条件に対応するために,リアルタイム遅延制約を満たすとともに検出精度を最大化するため,分割点と量子化レベルを選択する動的最適化アルゴリズムを導入する。
実時間帯域幅の可変性に基づくトレースベース評価では、この適応的手法は、同じレイテンシ性能を持つ静的パラメータ化よりも最大20%精度が向上することを示している。
関連論文リスト
- SparseCoop: Cooperative Perception with Kinematic-Grounded Queries [24.54324085409114]
SparseCoopは3次元検出と追跡のための完全にスパースな協調認識フレームワークである。
2X-SeqとGriffinのデータセットの実験は、SparseCoopが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2025-12-07T13:22:06Z) - Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [54.53508601749513]
本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバーヘッドを最大52%削減し,システム遅延を最大63%削減できることがわかった。
論文 参考訳(メタデータ) (2025-03-17T08:37:22Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - AdaShadow: Responsive Test-time Model Adaptation in Non-stationary Mobile Environments [24.606016498430407]
本稿では,非定常移動データ配信と資源動態のための応答性テスト時間適応フレームワークであるAdaShadowを提案する。
AdaShadowは、レイヤの重要度とレイテンシを推定する上での課題と、最適なレイヤ更新計画のスケジューリングに対処する。
その結果,AdaShadowは連続的なシフトの下で最高の精度-遅延バランスを達成することがわかった。
論文 参考訳(メタデータ) (2024-10-10T16:41:39Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - Edge-Enabled Real-time Railway Track Segmentation [0.0]
エッジ対応鉄道線路分割アルゴリズムを提案する。
ネットワーク構造を最適化し、トレーニング後のモデルを定量化することで、エッジアプリケーションに適したように最適化されている。
実験結果から,提案アルゴリズムの精度は83.3%であった。
論文 参考訳(メタデータ) (2024-01-21T13:45:52Z) - Latency-aware Unified Dynamic Networks for Efficient Image Recognition [72.8951331472913]
LAUDNetは動的ネットワークの理論的および実用的な効率ギャップを橋渡しするフレームワークである。
3つの主要な動的パラダイム - 適応型計算、動的層スキップ、動的チャネルスキップ - を統合している。
これにより、V100,3090やTX2 GPUのようなプラットフォーム上で、ResNetのようなモデルの遅延を50%以上削減できる。
論文 参考訳(メタデータ) (2023-08-30T10:57:41Z) - Leveraging the Edge and Cloud for V2X-Based Real-Time Object Detection
in Autonomous Driving [0.0]
環境認識は自動運転の重要な要素である。
本稿では,自動運転車のリアルタイム認識における検出品質と遅延の最良のトレードオフについて検討する。
我々は,局所的な検出性能を向上しつつ,適切な圧縮を伴うモデルをクラウド上でリアルタイムに実行可能であることを示す。
論文 参考訳(メタデータ) (2023-08-09T21:39:10Z) - Gradient Sparsification for Efficient Wireless Federated Learning with
Differential Privacy [25.763777765222358]
フェデレートラーニング(FL)により、分散クライアントは、生データを互いに共有することなく、機械学習モデルを協調的にトレーニングできる。
モデルのサイズが大きくなるにつれて、送信帯域の制限によるトレーニングのレイテンシが低下し、個人情報が劣化すると同時に、差分プライバシ(DP)保護を使用する。
我々は、収束性能を犠牲にすることなく、トレーニング効率を向上させるために、FLフレームワーク無線チャネルのスペース化を提案する。
論文 参考訳(メタデータ) (2023-04-09T05:21:15Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Toward fast and accurate human pose estimation via soft-gated skip
connections [97.06882200076096]
本稿では,高精度かつ高効率な人間のポーズ推定について述べる。
我々は、最先端技術よりも精度と効率を両立させる文脈において、この設計選択を再分析する。
本モデルでは,MPII と LSP のデータセットから最先端の結果が得られる。
論文 参考訳(メタデータ) (2020-02-25T18:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。