論文の概要: Task-Oriented Communications for 3D Scene Representation: Balancing Timeliness and Fidelity
- arxiv url: http://arxiv.org/abs/2509.17282v1
- Date: Sun, 21 Sep 2025 23:40:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.197552
- Title: Task-Oriented Communications for 3D Scene Representation: Balancing Timeliness and Fidelity
- Title(参考訳): 3次元シーン表現のためのタスク指向コミュニケーション:タイムラインと忠実さのバランス
- Authors: Xiangmin Xu, Zhen Meng, Kan Chen, Jiaming Yang, Emma Li, Philip G. Zhao, David Flynn,
- Abstract要約: リアルタイム3Dシーン表現は、最先端の幅広いアプリケーションをサポートする。
3Dシーンの表現において、タイムラインと忠実さのバランスをとることは、依然として課題である。
本研究では,複数の同種移動ロボットがカメラを搭載し,環境を捉え,映像を3D表現のためにエッジサーバに送信する無線ネットワークについて検討する。
- 参考スコア(独自算出の注目度): 25.27019504900863
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Real-time Three-dimensional (3D) scene representation is a foundational element that supports a broad spectrum of cutting-edge applications, including digital manufacturing, Virtual, Augmented, and Mixed Reality (VR/AR/MR), and the emerging metaverse. Despite advancements in real-time communication and computing, achieving a balance between timeliness and fidelity in 3D scene representation remains a challenge. This work investigates a wireless network where multiple homogeneous mobile robots, equipped with cameras, capture an environment and transmit images to an edge server over channels for 3D representation. We propose a contextual-bandit Proximal Policy Optimization (PPO) framework incorporating both Age of Information (AoI) and semantic information to optimize image selection for representation, balancing data freshness and representation quality. Two policies -- the $\omega$-threshold and $\omega$-wait policies -- together with two benchmark methods are evaluated, timeliness embedding and weighted sum, on standard datasets and baseline 3D scene representation models. Experimental results demonstrate improved representation fidelity while maintaining low latency, offering insight into the model's decision-making process. This work advances real-time 3D scene representation by optimizing the trade-off between timeliness and fidelity in dynamic environments.
- Abstract(参考訳): リアルタイム3次元シーン表現(Real-time Three-dimensional scene representation)は、デジタル製造、バーチャル、拡張現実、複合現実感(VR/AR/MR)、新興メタバースなど、幅広い最先端アプリケーションをサポートする基本的な要素である。
リアルタイム通信とコンピューティングの進歩にもかかわらず、3Dシーンの表現におけるタイムラインと忠実さのバランスを達成することは依然として課題である。
本研究では,複数の同種移動ロボットがカメラを搭載し,環境を捉え,映像を3D表現のためにエッジサーバに送信する無線ネットワークについて検討する。
本稿では、情報時代(AoI)と意味情報の両方を取り入れた文脈帯域最適化(PPO)フレームワークを提案し、表現のための画像選択を最適化し、データの鮮度と表現品質のバランスをとる。
標準データセットとベースラインの3Dシーン表現モデル上で、$\omega$-thresholdと$\omega$-waitという2つのポリシーと2つのベンチマークメソッド、タイムラインの埋め込みと重み付けの合計が評価される。
実験結果は、低レイテンシを維持しながら表現の忠実性を改善し、モデルの意思決定プロセスに関する洞察を提供する。
この研究は、動的環境におけるタイムラインと忠実度の間のトレードオフを最適化することにより、リアルタイムな3Dシーン表現を推し進める。
関連論文リスト
- SPATIALGEN: Layout-guided 3D Indoor Scene Generation [37.30623176278608]
本研究では,現実的でセマンティックに整合した室内シーンを生成するマルチビューマルチモーダル拡散モデルであるSpatialGenを提案する。
3次元レイアウトと参照画像が与えられたモデルでは、任意の視点から外観(カラー画像)、幾何学(シーン座標マップ)、意味(セマンティックセグメンテーションマップ)を合成する。
私たちは、コミュニティを力づけ、屋内のシーン理解と生成の分野を前進させるために、データとモデルをオープンソース化しています。
論文 参考訳(メタデータ) (2025-09-18T14:12:32Z) - EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.1662426227688]
既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文 参考訳(メタデータ) (2025-03-26T02:47:27Z) - 4D Gaussian Splatting: Modeling Dynamic Scenes with Native 4D Primitives [115.67081491747943]
動的3Dシーン表現と新しいビュー合成はAR/VRおよびメタバースアプリケーションの実現に不可欠である。
我々は,その基礎となる4次元体積を近似として,時間変化の異なる3次元シーンの再構成を再構成する。
ストレージのボトルネックに対処するため、メモリフットプリントを効果的に削減するいくつかのコンパクトなバリエーションを導出する。
論文 参考訳(メタデータ) (2024-12-30T05:30:26Z) - Timeliness-Fidelity Tradeoff in 3D Scene Representations [21.83480597828125]
本稿では,リアルタイム3次元シーン表現におけるタイムラインと忠実さのトレードオフについて検討する。
具体的には,通信遅延がトレードオフに与える影響を評価する枠組みを確立する。
3次元シーン表現の忠実度を改善するために,一段階のPPO法を提案する。
論文 参考訳(メタデータ) (2024-07-23T15:30:08Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - AutoDecoding Latent 3D Diffusion Models [95.7279510847827]
本稿では,3次元オートデコーダをコアとした静的・明瞭な3次元アセットの生成に対して,新しいアプローチを提案する。
3D Autodecoderフレームワークは、ターゲットデータセットから学んだプロパティを潜時空間に埋め込む。
次に、適切な中間体積潜在空間を特定し、ロバストな正規化と非正規化演算を導入する。
論文 参考訳(メタデータ) (2023-07-07T17:59:14Z) - LiP-Flow: Learning Inference-time Priors for Codec Avatars via
Normalizing Flows in Latent Space [90.74976459491303]
実行時入力に条件付けされた先行モデルを導入し、この先行空間を潜伏空間の正規化フローを介して3次元顔モデルに結びつける。
正規化フローは2つの表現空間をブリッジし、潜在サンプルをある領域から別の領域に変換することで、潜在可能性の目的を定義する。
提案手法は,表情のダイナミックスや微妙な表現をよりよく捉えることによって,表現的かつ効果的に先行することを示す。
論文 参考訳(メタデータ) (2022-03-15T13:22:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。