論文の概要: RedunCut: Measurement-Driven Sampling and Accuracy Performance Modeling for Low-Cost Live Video Analytics
- arxiv url: http://arxiv.org/abs/2512.24386v1
- Date: Tue, 30 Dec 2025 18:01:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.451674
- Title: RedunCut: Measurement-Driven Sampling and Accuracy Performance Modeling for Low-Cost Live Video Analytics
- Title(参考訳): RedunCut:低コストライブビデオ分析のための計測駆動サンプリングと精度パフォーマンスモデリング
- Authors: Gur-Eyal Sela, Kumar Krishna Agrawal, Bharathan Balaji, Joseph Gonzalez, Ion Stoica,
- Abstract要約: ライブビデオ分析(LVA)は、大規模なカメラ群にわたって継続的に実行されるが、現代のビジョンモデルによる推論コストは高いままである。
これを解決するために、動的モデルサイズ選択(DMSS)は魅力的なアプローチである。
サンプリングの費用対効果のトレードオフを推定する計測駆動プランナと、精度予測を改善するために軽量でデータ駆動のパフォーマンスモデルを用いています。
- 参考スコア(独自算出の注目度): 30.27628949620967
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Live video analytics (LVA) runs continuously across massive camera fleets, but inference cost with modern vision models remains high. To address this, dynamic model size selection (DMSS) is an attractive approach: it is content-aware but treats models as black boxes, and could potentially reduce cost by up to 10x without model retraining or modification. Without ground truth labels at runtime, we observe that DMSS methods use two stages per segment: (i) sampling a few models to calculate prediction statistics (e.g., confidences), then (ii) selection of the model size from those statistics. Prior systems fail to generalize to diverse workloads, particularly to mobile videos and lower accuracy targets. We identify that the failure modes stem from inefficient sampling whose cost exceeds its benefit, and inaccurate per-segment accuracy prediction. In this work, we present RedunCut, a new DMSS system that addresses both: It uses a measurement-driven planner that estimates the cost-benefit tradeoff of sampling, and a lightweight, data-driven performance model to improve accuracy prediction. Across road-vehicle, drone, and surveillance videos and multiple model families and tasks, RedunCut reduces compute cost by 14-62% at fixed accuracy and remains robust to limited historical data and to drift.
- Abstract(参考訳): ライブビデオ分析(LVA)は、大規模なカメラ群にわたって継続的に実行されるが、現代のビジョンモデルによる推論コストは高いままである。
これを解決するために、動的モデルサイズ選択(DMSS)は魅力的なアプローチである。それはコンテンツに認識されているが、モデルをブラックボックスとして扱い、モデルの再トレーニングや修正なしに最大10倍のコストを削減できる可能性がある。
実行時に真理ラベルがなければ、DMSSメソッドはセグメント毎に2つのステージを使用する。
(i)予測統計(例えば、信頼度)を計算するためにいくつかのモデルをサンプリングし、
(ii)これらの統計からモデルサイズを選択する。
それまでのシステムは、さまざまなワークロード、特にモバイルビデオや低い精度ターゲットに一般化できなかった。
フェールモードは,コストが利益を上回る非効率なサンプリングと,セグメント毎の精度予測の不正確さに起因する。
本研究では,サンプリングの費用対効果のトレードオフを推定する計測駆動型プランナと,精度の予測を改善するための軽量なデータ駆動性能モデルを用いて,DMSSの新たなシステムであるRedunCutを提案する。
RedunCutは、道路やドローン、監視ビデオ、複数のモデルファミリーやタスクなどを通じて、計算コストを一定の精度で14~62%削減する。
関連論文リスト
- ScaleDL: Towards Scalable and Efficient Runtime Prediction for Distributed Deep Learning Workloads [14.876533021201539]
ScaleDLはディープニューラルネットワーク(DNN)のための新しいランタイム予測フレームワーク
非線形層モデリングとグラフニューラルネットワーク(GNN)に基づく層間相互作用機構を組み合わせる。
実験の結果,ScaleDLは実行時の予測精度と一般化性を向上し,MREの6倍,RMSEの5倍の精度を実現した。
論文 参考訳(メタデータ) (2025-11-06T08:05:55Z) - Establishing Task Scaling Laws via Compute-Efficient Model Ladders [136.76316239300363]
我々は,事前訓練された言語モデル(LM)のタスク性能を予測するために,タスクスケーリング法則とモデルはしごを開発する。
2つの予測ステップのパラメータ化関数に適合するデータポイントを収集し、2つの対象モデルの予測を行う。
ランク付けされた4つの多重選択タスクにおいて、絶対誤差の2ポイント以内で、両方のターゲットモデルの精度を予測することができる。
論文 参考訳(メタデータ) (2024-12-05T18:21:49Z) - Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文 参考訳(メタデータ) (2024-11-30T10:56:30Z) - Model Cascading for Code: A Cascaded Black-Box Multi-Model Framework for Cost-Efficient Code Completion with Self-Testing [20.445496441396028]
本稿では,モデルカスケーディングと推論時自己テストアルゴリズムを組み合わせた新しいフレームワークを提案する。
このアプローチでは,自己生成テストを活用して精度を高め,モデルのカスケード決定を評価する。
実験結果から, カスケード手法はコストを平均26%削減し, ベストケースでは最大70%削減できることがわかった。
論文 参考訳(メタデータ) (2024-05-24T16:20:04Z) - A Training Rate and Survival Heuristic for Inference and Robustness Evaluation (TRASHFIRE) [1.622320874892682]
この研究は、特定のモデルハイパーパラメータが、相手の存在下でモデルの性能にどのように影響するかを理解し予測する問題に対処する。
提案手法では、サバイバルモデル、最悪の例、コスト認識分析を用いて、特定のモデル変更を正確かつ正確に拒否する。
提案手法を用いて、最も単純なホワイトボックス攻撃に対して、ResNetは絶望的に反対であることを示す。
論文 参考訳(メタデータ) (2024-01-24T19:12:37Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Incremental Outlier Detection Modelling Using Streaming Analytics in Finance & Health Care [0.0]
リアルタイムデータの時代において、従来の手法はストリーミング環境の動的な性質に追従するのに苦労することが多い。
本稿では,モデルを一度構築し,リアルタイム環境下で評価するハイブリッドフレームワークを提案する。
我々は、一級サポートベクターマシン(OCSVM)、孤立林適応型スライドウィンドウアプローチ(IForest ASD)、正確な嵐(ES)、角度ベース外乱検出(ABOD)、局所外乱係数(LOF)、Kitsunesオンラインアルゴリズム(KitNet)、K-nearest近隣の8種類の最先端外乱検出モデルを採用した。
論文 参考訳(メタデータ) (2023-05-17T02:30:28Z) - Maintaining Stability and Plasticity for Predictive Churn Reduction [8.971668467496055]
我々は,累積モデル組合せ (AMC) という解を提案する。
AMCは一般的な手法であり、モデルやデータ特性に応じてそれぞれ独自の利点を持ついくつかの事例を提案する。
論文 参考訳(メタデータ) (2023-05-06T20:56:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。