Fugu-MT 論文翻訳(概要): OrbitStream: Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields

論文の概要: OrbitStream: Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields

arxiv url: http://arxiv.org/abs/2603.20999v1
Date: Sun, 22 Mar 2026 01:16:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-24 19:11:39.190076
Title: OrbitStream: Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields
Title（参考訳）: OrbitStream: セマンティックポテンシャル場によるトレーニング不要の適応型360度ビデオストリーミング
Authors: Aizierjiang Aiersilan, Zhangfei Yang,
Abstract要約: セマンティックなシーン理解とロバストな制御理論を組み合わせた,トレーニング不要なフレームワークOrbitStreamを提案する。多様なネットワークトレースに関する3600のモンテカルロシミュレーションで、OrbitStreamの平均QoEは2.71である。このシステムは、最小リバッファイベントで1.01ミリ秒の平均決定遅延を示す。
参考スコア（独自算出の注目度）: 4.726777092009554
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Adaptive 360° video streaming for teleoperation faces dual challenges: viewport prediction under uncertain gaze patterns and bitrate adaptation over volatile wireless channels. While data-driven and Deep Reinforcement Learning (DRL) methods achieve high Quality of Experience (QoE), their "black-box" nature and reliance on training data can limit deployment in safety-critical systems. To address this, we propose OrbitStream, a training-free framework that combines semantic scene understanding with robust control theory. We formulate viewport prediction as a Gravitational Viewport Prediction (GVP) problem, where semantic objects generate potential fields that attract user gaze. Furthermore, we employ a Saturation-Based Proportional-Derivative (PD) Controller for buffer regulation. On object-rich teleoperation traces, OrbitStream achieves a 94.7\% zero-shot viewport prediction accuracy without user-specific profiling, approaching trajectory-extrapolation baselines ($\sim$98.5\%). Across 3,600 Monte Carlo simulations on diverse network traces, OrbitStream yields a mean QoE of 2.71. It ranks second among 12 evaluated algorithms, close to the top-performing BOLA-E (2.80) while outperforming FastMPC (1.84). The system exhibits an average decision latency of 1.01 ms with minimal rebuffering events. By providing competitive QoE with interpretability and zero training overhead, OrbitStream demonstrates that physics-based control, combined with semantic modeling, offers a practical solution for 360° streaming in teleoperation.
Abstract（参考訳）: 遠隔操作のための適応型360度ビデオストリーミングは、不確実な視線パターン下でのビューポート予測と、揮発性無線チャネル上でのビットレート適応という2つの課題に直面している。データ駆動型および深層強化学習(DRL)手法は、高い品質・オブ・エクスペリエンス(QoE)を実現する一方で、トレーニングデータに対する"ブラックボックス"の性質と依存は、安全クリティカルなシステムへのデプロイメントを制限する可能性がある。そこで本研究では,セマンティックなシーン理解とロバストな制御理論を組み合わせた,トレーニング不要なフレームワークOrbitStreamを提案する。我々は、ビューポート予測を、ユーザを惹きつける潜在的なフィールドを生成するような、重力的ビューポート予測(GVP)問題として定式化する。さらに、バッファ制御のために飽和型比例微分制御器(PD)を用いる。オブジェクトリッチな遠隔操作トレースでは、OrbitStreamは、ユーザー固有のプロファイリングなしで94.7\%のゼロショットビューポート予測精度を達成し、トラジェクトリ・エクストラポーレーションベースライン($98.5\%)に近づいた。多様なネットワークトレースに関する3600のモンテカルロシミュレーションで、OrbitStreamの平均QoEは2.71である。 BOLA-E (2.80) に近く、FastMPC (1.84) に勝っている。このシステムは、最小リバッファイベントで1.01ミリ秒の平均決定遅延を示す。 OrbitStreamは、解釈可能性とトレーニングのオーバーヘッドをゼロにする競争力のあるQoEを提供することで、物理ベースの制御とセマンティックモデリングを組み合わせることで、遠隔操作における360度ストリーミングの実用的なソリューションを提供することを示した。

関連論文リスト

Dual-Path Enhancements in Event-Based Eye Tracking: Augmented Robustness and Adaptive Temporal Modeling [0.0]
イベントベースのアイトラッキングは、拡張現実と人間とコンピュータのインタラクションにとって重要な技術となっている。既存の方法は、突然の眼球運動や環境騒音といった現実的な課題に苦しむ。まず、時間シフト、空間的フリップ、イベント削除を組み込んだ堅牢なデータ拡張パイプラインにより、モデルのレジリエンスが向上する。 2つ目は、空間的特徴抽出のための効率的なNet-B3バックボーン、文脈時空間モデリングのための双方向GRU、線形時変状態空間モジュールを組み合わせたハイブリッドアーキテクチャであるKnightPupilを提案する。
論文参考訳（メタデータ） (2025-04-14T07:57:22Z)
ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文参考訳（メタデータ） (2024-11-12T11:32:56Z)
Is That Rain? Understanding Effects on Visual Odometry Performance for Autonomous UAVs and Efficient DNN-based Rain Classification at the Edge [1.8936798735951972]
最先端のローカルトラッキングと軌道計画は通常、飛行制御アルゴリズムにカメラセンサーを入力して実行される。最先端のビジュアル・オドメトリーシステムでは, 1.5mの最悪ケース平均追跡誤差が可能であることを示す。我々は、モバイルおよび制約されたデプロイメントシナリオに適したディープニューラルネットワークモデルのセットをトレーニングし、これらの雨の条件を効率的に正確に分類できる範囲を判断する。
論文参考訳（メタデータ） (2024-07-17T15:47:25Z)
MADRL-Based Rate Adaptation for 360° Video Streaming with Multi-Viewpoint Prediction [3.8611070161950916]
360degビデオ再生の鍵となる課題は、ネットワーク帯域幅が制限された高品質なエクスペリエンス(QoE)を保証することである。現在、ほとんどの研究は、単一のビューポート予測に基づいてタイルベースの適応型ストリーミング(ABR)に焦点を当てている。本稿ではまず,複数の視点軌跡を歴史的軌跡として生成する多モード空間的注意変換器を提案する。その後,360degビデオストリーミングのための多視点予測を用いたマルチエージェントディープ強化学習(MADRL)に基づくABRアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-13T13:59:59Z)
Trace and Pace: Controllable Pedestrian Animation via Guided Trajectory Diffusion [83.88829943619656]
本研究では,現実的な歩行者軌跡生成手法と,ユーザ定義目標を達成するために制御可能なフルボディアニメーションを提案する。我々のガイド付き拡散モデルでは,対象とする経路,速度,特定社会集団による軌道の制約が可能である。本稿では,アニメーションコントローラのRLトレーニング中に学習した値関数を用いて,拡散を誘導し,特定のシナリオに適した軌道を生成することを提案する。
論文参考訳（メタデータ） (2023-04-04T15:46:42Z)
It Takes Two: Masked Appearance-Motion Modeling for Self-supervised Video Transformer Pre-training [76.69480467101143]
自己監督型ビデオトランスフォーマーの事前トレーニングは、最近マスク・アンド・予測パイプラインの恩恵を受けている。本稿では,映像中の動きの手がかりを余分な予測対象として明示的に調査し,マスケッド・出現運動モデリングフレームワークを提案する。一般的なビデオ表現を学習し、Kinects-400で82.3%、Something V2で71.3%、UCF101で91.5%、HMDB51で62.5%を達成する。
論文参考訳（メタデータ） (2022-10-11T08:05:18Z)
Globally Optimal Event-Based Divergence Estimation for Ventral Landing [55.29096494880328]
イベントセンシングはバイオインスパイアされた飛行誘導と制御システムの主要なコンポーネントである。本研究では, イベントカメラを用いた腹側着陸時の表面との接触時間予測について検討する。これは、着陸時に発生する事象の流れから放射光の流れの速度である発散(逆TTC)を推定することで達成される。我々のコアコントリビューションは、イベントベースの発散推定のための新しいコントラスト最大化定式化と、コントラストを正確に最大化し、最適な発散値を求めるブランチ・アンド・バウンドアルゴリズムである。
論文参考訳（メタデータ） (2022-09-27T06:00:52Z)
StreamYOLO: Real-time Object Detection for Streaming Perception [84.2559631820007]
将来を予測する能力を備えたモデルを提供し、ストリーミング知覚の結果を大幅に改善する。本稿では,複数の速度を駆動するシーンについて考察し,VasAP(Velocity-Awared streaming AP)を提案する。本手法は,Argoverse-HDデータセットの最先端性能を実現し,SAPとVsAPをそれぞれ4.7%,VsAPを8.2%改善する。
論文参考訳（メタデータ） (2022-07-21T12:03:02Z)
Real-time Object Detection for Streaming Perception [84.2559631820007]
ストリーミング知覚は,ビデオオンライン知覚の1つの指標として,レイテンシと精度を共同評価するために提案される。ストリーミング知覚のためのシンプルで効果的なフレームワークを構築します。提案手法はArgoverse-HDデータセット上での競合性能を実現し,強力なベースラインに比べてAPを4.9%向上させる。
論文参考訳（メタデータ） (2022-03-23T11:33:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。