論文の概要: Croesus: Multi-Stage Processing and Transactions for Video-Analytics in
Edge-Cloud Systems
- arxiv url: http://arxiv.org/abs/2201.00063v1
- Date: Fri, 31 Dec 2021 21:38:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 02:49:47.103756
- Title: Croesus: Multi-Stage Processing and Transactions for Video-Analytics in
Edge-Cloud Systems
- Title(参考訳): Croesus: エッジクラウドシステムにおけるビデオ分析のためのマルチステージ処理とトランザクション
- Authors: Samaa Gazzaz, Vishal Chakraborty, Faisal Nawab
- Abstract要約: Croesusはエッジクラウドシステムに対するマルチステージアプローチであり、正確性とパフォーマンスのバランスを見つける機能を提供する。
本稿では,このような手法がビデオ分析のユースケースに与える影響を実演し,マルチステージ処理が精度と性能のバランスを良くすることを示す。
- 参考スコア(独自算出の注目度): 2.9864637081333085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emerging edge applications require both a fast response latency and complex
processing. This is infeasible without expensive hardware that can process
complex operations -- such as object detection -- within a short time. Many
approach this problem by addressing the complexity of the models -- via model
compression, pruning and quantization -- or compressing the input. In this
paper, we propose a different perspective when addressing the performance
challenges. Croesus is a multi-stage approach to edge-cloud systems that
provides the ability to find the balance between accuracy and performance.
Croesus consists of two stages (that can be generalized to multiple stages): an
initial and a final stage. The initial stage performs the computation in
real-time using approximate/best-effort computation at the edge. The final
stage performs the full computation at the cloud, and uses the results to
correct any errors made at the initial stage. In this paper, we demonstrate the
implications of such an approach on a video analytics use-case and show how
multi-stage processing yields a better balance between accuracy and
performance. Moreover, we study the safety of multi-stage transactions via two
proposals: multi-stage serializability (MS-SR) and multi-stage invariant
confluence with Apologies (MS-IA).
- Abstract(参考訳): エッジアプリケーションは高速な応答遅延と複雑な処理の両方を必要とする。
これは、オブジェクト検出などの複雑な操作を短時間で処理できる高価なハードウェアなしでは実現できない。
多くの人はモデルの複雑さ -- モデル圧縮、プラニング、量子化 -- に対処するか、入力を圧縮することによって、この問題にアプローチします。
本稿では,パフォーマンス上の課題に取り組む際に異なる視点を提案する。
Croesusはエッジクラウドシステムに対するマルチステージアプローチであり、正確性とパフォーマンスのバランスを見つける機能を提供する。
クロエウスは2つの段階(これは複数の段階に一般化できる)から成り、初期段階と最終段階である。
初期段階は、エッジでの近似/ベストプラクティス計算を用いて、リアルタイムに計算を行う。
最終段階は、クラウドで完全な計算を行い、その結果を使用して、初期段階で発生したエラーを修正する。
本稿では,このような手法がビデオ解析のユースケースに与える影響を実証し,多段処理が精度と性能のバランスをいかに良くするかを示す。
さらに,マルチステージシリアライザビリティ(MS-SR)とマルチステージ不変コンバレンス(MS-IA)という2つの提案を通じて,マルチステージトランザクションの安全性を検討する。
関連論文リスト
- One Diffusion to Generate Them All [54.82732533013014]
OneDiffusionは双方向画像合成と理解をサポートする汎用的で大規模な拡散モデルである。
テキスト、深さ、ポーズ、レイアウト、セマンティックマップなどの入力から条件生成を可能にする。
OneDiffusionは、シーケンシャルな画像入力を使用して、マルチビュー生成、カメラポーズ推定、即時パーソナライズを可能にする。
論文 参考訳(メタデータ) (2024-11-25T12:11:05Z) - Incremental Multiview Point Cloud Registration with Two-stage Candidate Retrieval [12.528821749262931]
マルチビューポイントクラウド登録は、様々なコンピュータビジョンタスクの基盤となる。
本稿では,すべてのスキャンを段階的にメタ形状に登録するインクリメンタルなマルチビューポイントクラウド登録手法を提案する。
論文 参考訳(メタデータ) (2024-07-10T10:24:28Z) - TrackFormers: In Search of Transformer-Based Particle Tracking for the High-Luminosity LHC Era [2.9052912091435923]
高エネルギー物理実験は、新しいイテレーション毎に複数倍のデータの増加に直面している。
このようなオーバーホールが必要なステップの1つは、粒子トラックの再構築、すなわち追跡のタスクである。
機械学習支援ソリューションは、大幅な改善が期待されている。
論文 参考訳(メタデータ) (2024-07-09T18:47:25Z) - Efficient Time Series Processing for Transformers and State-Space Models through Token Merging [44.27818172708914]
トークンマージにより、視覚変換器アーキテクチャのスループットが大幅に向上することが示されている。
局所的マージとは、局所的な領域内でトークンを選択的に結合する、ドメイン固有のトークンマージアルゴリズムである。
最近提案されたクロノス基礎モデルでは, わずかな精度劣化のみを伴い, 5400%の加速を実現している。
論文 参考訳(メタデータ) (2024-05-28T08:28:18Z) - Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。
バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z) - Single-Stage Visual Relationship Learning using Conditional Queries [60.90880759475021]
TraCQは、マルチタスク学習問題とエンティティペアの分布を回避する、シーングラフ生成の新しい定式化である。
我々は,DETRをベースとしたエンコーダ-デコーダ条件付きクエリを用いて,エンティティラベル空間を大幅に削減する。
実験結果から、TraCQは既存のシングルステージシーングラフ生成法よりも優れており、Visual Genomeデータセットの最先端の2段階メソッドを多く上回っていることがわかった。
論文 参考訳(メタデータ) (2023-06-09T06:02:01Z) - Parameter-efficient Tuning of Large-scale Multimodal Foundation Model [68.24510810095802]
我々はこれらの課題を克服するために、クロスモーダル転送(Aurora)のための優雅なプロンプトフレームワークを提案する。
既存のアーキテクチャの冗長性を考慮すると、まずモード近似を用いて0.1Mのトレーニング可能なパラメータを生成し、マルチモーダルプロンプトチューニングを実装する。
6つのクロスモーダルベンチマークの徹底的な評価は、最先端のベンチマークを上回るだけでなく、完全な微調整アプローチよりも優れていることを示している。
論文 参考訳(メタデータ) (2023-05-15T06:40:56Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - D2C-SR: A Divergence to Convergence Approach for Image Super-Resolution [25.17545119739454]
画像超解像(SR)のための新しいフレームワークD2C-SRを提案する。
SRFlowのような最近の作品に触発され、私たちはこの問題を半確率的に対処します。
実験により,PSNRおよびSSIMにおけるD2C-SRの性能は,計算コストが大幅に低減された。
論文 参考訳(メタデータ) (2021-03-26T10:20:28Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z) - Learning multiview 3D point cloud registration [74.39499501822682]
本稿では,エンドツーエンドで学習可能なマルチビュー3Dポイントクラウド登録アルゴリズムを提案する。
このアプローチは、エンドツーエンドのトレーニングが可能で、計算コストが小さく、最先端のマージンよりも優れています。
論文 参考訳(メタデータ) (2020-01-15T03:42:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。