論文の概要: SemanticXR: Low Power and Real-time Queryable Semantic Mapping with an Object-Level Device-Cloud Architecture
- arxiv url: http://arxiv.org/abs/2606.12849v1
- Date: Thu, 11 Jun 2026 03:24:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.561262
- Title: SemanticXR: Low Power and Real-time Queryable Semantic Mapping with an Object-Level Device-Cloud Architecture
- Title(参考訳): SemanticXR: オブジェクトレベルデバイスクラウドアーキテクチャによる低消費電力でリアルタイムにクエリ可能なセマンティックマッピング
- Authors: Rahul Singh, Devdeep Ray, Connor Smith, Sarita Adve,
- Abstract要約: 本稿では,セマンティックXRを提案する。セマンティックXRは,リアルタイムでオープンなセマンティックマッピングとクエリのための,最初のデバイスクラウドシステムである。
私たちのキーとなる洞察は、セマンティックに識別可能なオブジェクトを、デバイスとサーバ間の通信、実行、メモリの第一級単位に高めることです。
デバイス上では、SemanticXRは100ms以下のクエリレイテンシを最大1万オブジェクトまで維持し、500MB以内で数万オブジェクトをサポートするとともに、全シーンサイズではなく、マップ変更によるダウンストリーム帯域幅を拡大する。
- 参考スコア(独自算出の注目度): 2.2165845825140695
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic mapping is a core service that enables grounded interactions in emerging Extended Reality (XR) applications such as AI assistants and spatial object search. Deploying this capability on mobile XR devices requires a system that is open-vocabulary, real-time, and low-power. Existing approaches are compute-intensive and assume server-class resources. Cloud offloading offers a practical path, but no existing system splits semantic mapping across the device-cloud boundary or manages its communication, execution, and memory footprint. We present SemanticXR, the first device-cloud system for real-time, open-vocabulary semantic mapping and querying under XR power, bandwidth, and memory constraints. Our key insight is to elevate semantically identifiable objects to first-class units of communication, execution, and memory across the device and server. On the server, object-level parallelism and geometry downsampling improve mapping latency, while object-level depth-mapping co-design reduces upstream bandwidth. On the device, an object-level sparse local map with incremental updates and update prioritization enables network-robust querying with bounded memory and downstream bandwidth. Object-level configurable resource usage vs. quality trade-offs let applications and the system adapt mapping to application requirements and operating conditions, respectively. Against a device-cloud baseline with the same perception models, object-level organization improves server-side mapping latency by 2.2X at equal semantic quality. Depth-mapping co-design maintains upstream bandwidth under 2.5 Mbps. On the device, SemanticXR sustains sub-100 ms query latency for up to 10,000 objects even under network drops, supports tens of thousands of objects within 500 MB, and scales downstream bandwidth with map changes, not total scene size. The system adds only 2% device power during normal operation.
- Abstract(参考訳): セマンティックマッピング(Semantic mapping)は、AIアシスタントや空間オブジェクト検索といった、新たな拡張現実(XR)アプリケーションにおける接地的なインタラクションを可能にするコアサービスである。
モバイルXRデバイスにこの機能をデプロイするには、オープン語彙、リアルタイム、低消費電力のシステムが必要である。
既存のアプローチは計算集約的で、サーバクラスのリソースを前提としています。
クラウドオフロードは実用的なパスを提供するが、デバイスとクラウドの境界を越えてセマンティックマッピングを分割したり、通信、実行、メモリフットプリントを管理する既存のシステムは存在しない。
我々は、XRパワー、帯域幅、メモリ制約の下で、リアルタイムでオープンなセマンティックマッピングとクエリのための最初のデバイスクラウドシステムであるSemanticXRを提案する。
私たちのキーとなる洞察は、セマンティックに識別可能なオブジェクトを、デバイスとサーバ間の通信、実行、メモリの第一級単位に高めることです。
サーバ上では、オブジェクトレベルの並列性とジオメトリのダウンサンプリングによりマッピングのレイテンシが向上する一方、オブジェクトレベルの深さマッピングの共設計は上流の帯域幅を減少させる。
デバイス上では、インクリメンタルな更新と更新の優先順位付けを備えたオブジェクトレベルのスパースローカルマップが、バウンドメモリとダウンストリーム帯域でネットワークローバストクエリを可能にする。
オブジェクトレベルの設定可能なリソース使用量と品質のトレードオフにより、アプリケーションとシステムがそれぞれアプリケーション要件と運用条件にマッピングを適用することができます。
同じ知覚モデルを持つデバイスクラウドベースラインに対して、オブジェクトレベルの組織は、サーバ側のマッピングレイテンシを同等のセマンティック品質で2.2倍改善する。
深さマッピングの共設計は、2.5Mbps未満のアップストリーム帯域幅を維持している。
デバイス上では、SemanticXRは100ms以下のクエリレイテンシを最大1万オブジェクトまで維持し、500MB以内で数万オブジェクトをサポートするとともに、全シーンサイズではなく、マップ変更によるダウンストリーム帯域幅を拡大する。
このシステムは通常の運転中にわずか2%のデバイス電力しか供給しない。
関連論文リスト
- Profiling-Driven Adaptive Distributed Transformer Inference on Embedded Edge Deployment [60.442064966340524]
本稿では、WiFi経由で接続されたNVIDIA Jetson Orin Nanoデバイスに関するプロトタイプ研究を行う。
主な発見は、主なボトルネックは、ネットワーク帯域幅だけでなく、通信中のCPU-GPUステージングである。
実験によると、この戦略はフルテンソル交換と比較して遅延を65%-77%減らし、エネルギー消費を34%-52%減らしている。
論文 参考訳(メタデータ) (2026-05-25T10:39:28Z) - Progressive Semantic Communication for Efficient Edge-Cloud Vision-Language Models [0.3004066195320147]
VLM(Vision-Language Models)は、リソース制約のある組み込みプラットフォームへのデプロイが困難である。
クラウドへの完全なオフロード推論は、帯域幅に制限のある環境では現実的ではないことが多い。
エッジクラウドVLM推論のためのプログレッシブセマンティック通信フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-29T10:16:06Z) - Accelerating Sparse Convolutions in Voxel-Based Point Cloud Networks [0.34304285205574886]
Sparse Convolutionは、自動運転やAR/VRで広く使われている3Dポイントのクラウドネットワークを利用している。
SpCは入力されたボクセル座標、出力座標、ウェイトオフセット間のマッピングを格納するカーネルマップを構築し、次にこのマップを使用して特徴ベクトルを出力座標に計算する。
我々の研究はボクセル座標の3つの重要な性質を同定する:それらは整数値であり、限られた空間範囲内で有界であり、同じ物体表面上の幾何学的に連続するボクセルは互いに小さな空間オフセットに存在する可能性が高い。
私たちは最初のボクセルプロパタイアウェア、Spiraを設計しました
論文 参考訳(メタデータ) (2025-11-25T20:34:37Z) - MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents [84.62985963113245]
我々は,長時間のマルチターンタスクに対して,エージェントが一定のメモリで動作可能な,エンドツーエンドの強化学習フレームワークMEM1を紹介する。
各ターンでMEM1は、メモリ統合と推論を共同でサポートするコンパクトな共有内部状態を更新する。
その結果,MEM1-7Bは16目的のマルチホップQAタスクにおいて,Qwen2.5-14B-Instructと比較してメモリ使用量を3.7倍削減し,3.5倍の性能向上を示す。
論文 参考訳(メタデータ) (2025-06-18T19:44:46Z) - QuantCache: Adaptive Importance-Guided Quantization with Hierarchical Latent and Layer Caching for Video Generation [84.91431271257437]
Diffusion Transformers (DiTs) はビデオ生成において支配的なアーキテクチャとして登場した。
DiTには、計算コストやメモリコストの増大など、大きな欠点がある。
我々は,新しいトレーニングフリー推論アクセラレーションフレームワークQuantCacheを提案する。
論文 参考訳(メタデータ) (2025-03-09T10:31:51Z) - A Semantic Communication System for Real-time 3D Reconstruction Tasks [7.082386535888168]
本稿では,限られたモバイル機器を用いたリアルタイムなセマンティックマッピングタスクを実現する手法を提案する。
具体的には,リアルタイム・セマンティック・マッピングタスクのためのエンコーディング・デコード・セマンティック・コミュニケーション・フレームワークを設計する。
シミュレーション実験では、TUMデータセットに基づいて、システムが0.1%未満の誤差を持つことを確認した。
論文 参考訳(メタデータ) (2024-12-02T06:50:05Z) - SMOF: Streaming Modern CNNs on FPGAs with Smart Off-Chip Eviction [6.800641017055453]
本稿では,計算パイプラインに沿ったオフチップメモリに重み付けとアクティベーション消去機構を導入する。
提案機構は既存のツールフローに組み込まれ,オフチップメモリをバッファとして利用することで設計空間を拡大する。
SMOFは、競争力があり、場合によっては、コンピュータビジョンタスクの範囲で最先端のパフォーマンスを提供する能力を示した。
論文 参考訳(メタデータ) (2024-03-27T18:12:24Z) - Federated Learning for Energy-limited Wireless Networks: A Partial Model
Aggregation Approach [79.59560136273917]
デバイス間の限られた通信資源、帯域幅とエネルギー、およびデータ不均一性は、連邦学習(FL)の主要なボトルネックである
まず、部分モデルアグリゲーション(PMA)を用いた新しいFLフレームワークを考案する。
提案されたPMA-FLは、2つの典型的な異種データセットにおいて2.72%と11.6%の精度を改善する。
論文 参考訳(メタデータ) (2022-04-20T19:09:52Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - MAFAT: Memory-Aware Fusing and Tiling of Neural Networks for Accelerated
Edge Inference [1.7894377200944507]
機械学習ネットワークは、利用可能なメモリを容易に越えることができ、OSの過度なスワップによってレイテンシが増加する。
本稿では,メモリ使用量予測器と探索アルゴリズムを組み合わせることで,最適化されたファジングとタイリングの構成を提供する。
その結果、我々のアプローチはメモリの半分以下で実行でき、メモリの厳しい制約下では最大2.78の高速化を実現している。
論文 参考訳(メタデータ) (2021-07-14T19:45:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。