論文の概要: Sampling, Communication, and Prediction Co-Design for Synchronizing the
Real-World Device and Digital Model in Metaverse
- arxiv url: http://arxiv.org/abs/2208.04233v1
- Date: Sun, 31 Jul 2022 20:17:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-14 18:12:00.017227
- Title: Sampling, Communication, and Prediction Co-Design for Synchronizing the
Real-World Device and Digital Model in Metaverse
- Title(参考訳): メタバースにおける実世界デバイスとデジタルモデル同期のためのサンプリング・コミュニケーション・予測共同設計
- Authors: Zhen Meng, Changyang She, Guodong Zhao, and Daniele De Martini
- Abstract要約: 我々は,制約付き深層強化学習(DRL)アルゴリズムを開発した。
実世界のロボットアームとそのデジタルモデルからなるプロトタイプ上で,我々のフレームワークを検証する。
- 参考スコア(独自算出の注目度): 14.326344469446434
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The metaverse has the potential to revolutionize the next generation of the
Internet by supporting highly interactive services with the help of Mixed
Reality (MR) technologies; still, to provide a satisfactory experience for
users, the synchronization between the physical world and its digital models is
crucial. This work proposes a sampling, communication and prediction co-design
framework to minimize the communication load subject to a constraint on
tracking the Mean Squared Error (MSE) between a real-world device and its
digital model in the metaverse. To optimize the sampling rate and the
prediction horizon, we exploit expert knowledge and develop a constrained Deep
Reinforcement Learning (DRL) algorithm, named Knowledge-assisted Constrained
Twin-Delayed Deep Deterministic (KC-TD3) policy gradient algorithm. We validate
our framework on a prototype composed of a real-world robotic arm and its
digital model. Compared with existing approaches: (1) When the tracking error
constraint is stringent (MSE=0.002 degrees), our policy degenerates into the
policy in the sampling-communication co-design framework. (2) When the tracking
error constraint is mild (MSE=0.007 degrees), our policy degenerates into the
policy in the prediction-communication co-design framework. (3) Our framework
achieves a better trade-off between the average MSE and the average
communication load compared with a communication system without sampling and
prediction. For example, the average communication load can be reduced up to
87% when the track error constraint is 0.002 degrees. (4) Our policy
outperforms the benchmark with the static sampling rate and prediction horizon
optimized by exhaustive search, in terms of the tail probability of the
tracking error. Furthermore, with the assistance of expert knowledge, the
proposed algorithm KC-TD3 achieves better convergence time, stability, and
final policy performance.
- Abstract(参考訳): メタバースは、Mixed Reality(MR)技術によって高度にインタラクティブなサービスをサポートすることによって、インターネットの次世代に革命をもたらす可能性がある。
本研究は、実世界のデバイスとそのデジタルモデル間の平均二乗誤差(mse)追跡の制約を受ける通信負荷を最小限に抑えるためのサンプリング・通信・予測共設計フレームワークを提案する。
サンプリング速度と予測の地平線を最適化するために、専門知識を活用し、kc-td3ポリシー勾配アルゴリズムと呼ばれる制約付き深層強化学習(drl)アルゴリズムを開発した。
実世界のロボットアームとそのデジタルモデルからなるプロトタイプ上で,我々のフレームワークを検証する。
1) トラッキングエラー制約が厳密な場合(MSE=0.002度)、このポリシーはサンプリング・コミュニケーション協調設計フレームワークにおいてポリシーに縮退する。
2) 追従誤差制約が穏やかな場合(MSE=0.007度)、予測・通信協調設計の枠組みでポリシーに縮退する。
3) 平均mseと平均通信負荷とのトレードオフは, サンプリングや予測を行わず, 通信システムと比較して良好である。
例えば、トラックエラーの制約が0.002度である場合、平均的な通信負荷は87%まで削減できる。
(4)本ポリシーは,追跡誤差のテール確率の観点から,徹底探索により最適化された静的サンプリング率と予測地平線でベンチマークを上回っている。
さらに,提案手法であるkc-td3は,専門家の知識を活かし,収束時間,安定性,最終的な政策性能の向上を実現している。
関連論文リスト
- Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Semantic-Aware Remote Estimation of Multiple Markov Sources Under Constraints [9.514904359788156]
我々は,マルコフ音源の遠隔推定のための意味認識通信について,損失・速度制約のあるチャネル上で検討した。
送信周波数制約下での予測誤差の長期的状態依存コストを最小限に抑える最適スケジューリングポリシーを見いだす。
論文 参考訳(メタデータ) (2024-03-25T15:18:23Z) - Distributional Shift-Aware Off-Policy Interval Estimation: A Unified
Error Quantification Framework [8.572441599469597]
本研究では、無限水平マルコフ決定過程の文脈における高信頼オフ政治評価について検討する。
目的は、未知の行動ポリシーから事前に収集されたオフラインデータのみを用いて、対象の政策値に対する信頼区間(CI)を確立することである。
提案アルゴリズムは, 非線形関数近似設定においても, サンプル効率, 誤差ローバスト, 既知収束性を示す。
論文 参考訳(メタデータ) (2023-09-23T06:35:44Z) - Communication-Efficient Zeroth-Order Distributed Online Optimization:
Algorithm, Theory, and Applications [9.045332526072828]
本稿では,目標追跡のためのフェデレーション学習環境におけるマルチエージェントゼロ階オンライン最適化問題に焦点を当てる。
提案手法は、2つの関連するアプリケーションにおけるエラーとエラーの観点からさらに解析される。
論文 参考訳(メタデータ) (2023-06-09T03:51:45Z) - Task-Oriented Prediction and Communication Co-Design for Haptic
Communications [20.20316445430853]
本稿では,ハプティックコミュニケーションのためのタスク指向予測・コミュニケーション協調フレームワークを提案する。
提案したフレームワークは、タスクに依存しないベンチマークと比較して、無線リソースの消費を最大77.80%削減できる。
論文 参考訳(メタデータ) (2023-02-21T23:39:37Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - On Efficient Uncertainty Estimation for Resource-Constrained Mobile
Applications [0.0]
予測の不確実性は、モデル予測を補完し、下流タスクの機能を改善します。
Axolotlフレームワークを用いてモンテカルロ・ドロップアウト(MCDO)モデルを構築することでこの問題に対処する。
我々は,(1)CIFAR10データセットを用いた多クラス分類タスク,(2)より複雑な人体セグメンテーションタスクについて実験を行った。
論文 参考訳(メタデータ) (2021-11-11T22:24:15Z) - Accelerating Federated Edge Learning via Optimized Probabilistic Device
Scheduling [57.271494741212166]
本稿では,通信時間最小化問題を定式化し,解決する。
最適化されたポリシーは、トレーニングプロセスが進むにつれて、残りの通信ラウンドの抑制から、ラウンドごとのレイテンシの低減へと、徐々に優先順位を転換している。
提案手法の有効性は,自律運転における協調的3次元目標検出のユースケースを通じて実証される。
論文 参考訳(メタデータ) (2021-07-24T11:39:17Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。