論文の概要: Dedelayed: Deleting remote inference delay via on-device correction
- arxiv url: http://arxiv.org/abs/2510.13714v1
- Date: Wed, 15 Oct 2025 16:13:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.757166
- Title: Dedelayed: Deleting remote inference delay via on-device correction
- Title(参考訳): Dedelayed: デバイス上の修正によるリモート推論遅延の削除
- Authors: Dan Jacobellis, Mateen Ulhaq, Fabien Racapé, Hyomin Choi, Neeraja J. Yadwadkar,
- Abstract要約: 任意のリモート推論遅延を緩和する遅延補正手法であるDedelayedを導入する。
提案手法では,現在のフレームを処理し,重み付きリモートモデルが過去のフレームから計算する特徴を融合する軽量なローカルモデルを用いている。
- 参考スコア(独自算出の注目度): 5.382679710017697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote inference allows lightweight devices to leverage powerful cloud models. However, communication network latency makes predictions stale and unsuitable for real-time tasks. To address this, we introduce Dedelayed, a delay-corrective method that mitigates arbitrary remote inference delays, allowing the local device to produce low-latency outputs in real time. Our method employs a lightweight local model that processes the current frame and fuses in features that a heavyweight remote model computes from past frames. On video from the BDD100K driving dataset, Dedelayed improves semantic segmentation accuracy over the stronger of the local-only and remote-only baselines across all realistic communication network delays beyond 33 ms. Without incurring additional delay, it improves accuracy by 6.4 mIoU compared to fully local inference and 9.8 mIoU compared to remote inference, for a round-trip delay of 100 ms. The advantage grows under longer delays and higher-motion scenes, as delay-mitigated split inference sustains accuracy more effectively, providing clear advantages for real-time tasks that must remain aligned with the current world state.
- Abstract(参考訳): リモート推論により、軽量デバイスは強力なクラウドモデルを活用することができる。
しかし、通信ネットワークの遅延により、リアルタイムタスクには予測が不安定で不適当になる。
そこで我々は,遅延補正手法であるDedelayedを導入する。これは任意のリモート推論遅延を軽減し,ローカルデバイスが低遅延出力をリアルタイムで生成できるようにする。
提案手法では,現在のフレームを処理し,重み付きリモートモデルが過去のフレームから計算する特徴を融合する軽量なローカルモデルを用いている。
BDD100K駆動データセットのビデオでは、Dedelayedは、ローカルのみとリモートのみのベースラインが33msを超えるすべての現実的な通信ネットワーク遅延に対して、セマンティックセグメンテーションの精度を向上する。追加の遅延を発生させずに、完全なローカル推論と比較して6.4mIoU、100msのラウンドトリップ遅延に対して9.8mIoUの精度を向上する。遅延緩和されたスプリット推論の精度をより効果的に保ち、現在の世界状態と整合性を維持したリアルタイムタスクに対して明確なメリットを提供する。
関連論文リスト
- Adaptive Deadline and Batch Layered Synchronized Federated Learning [66.93447103966439]
フェデレートラーニング(FL)は、データプライバシを保持しながら、分散エッジデバイス間で協調的なモデルトレーニングを可能にする。
我々は,レイヤワイドアグリゲーションのために,ラウンド単位の期限とユーザ固有のバッチサイズを共同で最適化する新しいフレームワークADEL-FLを提案する。
論文 参考訳(メタデータ) (2025-05-29T19:59:18Z) - Faster and Better LLMs via Latency-Aware Test-Time Scaling [47.3923926808606]
テスト時間スケーリング(TTS)は、推論時の言語モデル(LLM)の性能向上に有効であることが証明されている。
既存の研究は、レイテンシに敏感な観点から、TSの効率性を見落としている。
計算最適TSは、レイテンシが重要となるシナリオにおいて、必ずしも最低レイテンシをもたらすとは限らないことを実証する。
論文 参考訳(メタデータ) (2025-05-26T07:51:30Z) - CorrDiff: Adaptive Delay-aware Detector with Temporal Cue Inputs for Real-time Object Detection [11.714072240331518]
CorrDiffは、リアルタイム検出システムの遅延問題に対処するために設計された。
複数の将来のフレームに対するオブジェクトの位置を予測するために、実行時推定の時間的キューを利用することができる。
あらゆる種類のデバイスにおいて、厳格なリアルタイム処理要件を満たす。
論文 参考訳(メタデータ) (2025-01-09T10:34:25Z) - MTD: Multi-Timestep Detector for Delayed Streaming Perception [0.5439020425819]
ストリーミング知覚は、自律運転システムの遅延と精度を評価するために使用される、世界の現在の状態を報告するタスクである。
本稿では,マルチブランチ将来の予測に動的ルーティングを利用するエンドツーエンド検出器MTDを提案する。
提案手法はArgoverse-HDデータセットを用いて評価され,実験結果から,様々な遅延設定における最先端性能が得られたことが示された。
論文 参考訳(メタデータ) (2023-09-13T06:23:58Z) - Service Delay Minimization for Federated Learning over Mobile Devices [36.027677482303076]
モバイルデバイス上でのフェデレーション学習は、多くの興味深いアプリケーション/サービスを生み出している。
本稿では,モバイル端末上でのサービス遅延効率FL(SDEFL)方式を提案する。
論文 参考訳(メタデータ) (2022-05-19T21:25:02Z) - R-TOD: Real-Time Object Detector with Minimized End-to-End Delay for
Autonomous Driving [3.366875318492424]
本稿では、エンドツーエンドの遅延をより包括的に理解することを目的としている。
i)オンデマンドキャプチャ、ii)ゼロスラックパイプライン、iii)競合のないパイプラインの3つの最適化手法が実装されている。
実験の結果,Darknet YOLO v3のエンド・ツー・エンド遅延は76%減少した。
論文 参考訳(メタデータ) (2020-10-23T01:03:46Z) - FastEmit: Low-latency Streaming ASR with Sequence-level Emission
Regularization [78.46088089185156]
ストリーム自動音声認識(ASR)は、仮説化された単語を可能な限り迅速かつ正確に出力することを目的としている。
既存のアプローチでは、シーケンストランスデューサモデルにおいて、トーケン単位またはフレーム単位の確率予測を演算することで、発光遅延をペナルティ化する。
本稿では,訓練用トランスデューサモデルにおいて,シーケンス毎の確率に遅延正規化を直接適用する,FastEmitというシーケンスレベルのエミッション正規化手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T17:05:01Z) - Towards Streaming Perception [70.68520310095155]
本稿では、リアルタイムオンライン知覚のための単一のメトリクスにレイテンシと精度を協調的に統合するアプローチを提案する。
この指標の背後にある重要な洞察は、瞬間ごとに認識スタック全体の出力を共同で評価することである。
本稿では,都市ビデオストリームにおけるオブジェクト検出とインスタンスセグメンテーションの具体的タスクに注目し,高品質で時間依存的なアノテーションを備えた新しいデータセットを寄贈する。
論文 参考訳(メタデータ) (2020-05-21T01:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。