論文の概要: Adaptive Streaming Perception using Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2106.05665v1
- Date: Thu, 10 Jun 2021 11:28:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-11 14:31:43.622072
- Title: Adaptive Streaming Perception using Deep Reinforcement Learning
- Title(参考訳): 深層強化学習を用いた適応型ストリーミング知覚
- Authors: Anurag Ghosh, Akshay Nambi, Aditya Singh, Harish YVS, Tanuja Ganu
- Abstract要約: ストリーミングビジュアルデータ上でコンピュータビジョンモデルを実行することは、新たな問題である。
ストリーミング認識のための,これらのトレードオフを実行時に学習するための,深層強化学習に基づく新しいアプローチについて述べる。
我々のエージェントは、複数の意思決定範囲で競合ポリシーを学習でき、公開データセットにおける最先端のポリシーよりも優れています。
- 参考スコア(独自算出の注目度): 0.26249027950824505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Executing computer vision models on streaming visual data, or streaming
perception is an emerging problem, with applications in self-driving, embodied
agents, and augmented/virtual reality. The development of such systems is
largely governed by the accuracy and latency of the processing pipeline. While
past work has proposed numerous approximate execution frameworks, their
decision functions solely focus on optimizing latency, accuracy, or energy,
etc. This results in sub-optimum decisions, affecting the overall system
performance. We argue that the streaming perception systems should holistically
maximize the overall system performance (i.e., considering both accuracy and
latency simultaneously). To this end, we describe a new approach based on deep
reinforcement learning to learn these tradeoffs at runtime for streaming
perception. This tradeoff optimization is formulated as a novel deep contextual
bandit problem and we design a new reward function that holistically integrates
latency and accuracy into a single metric. We show that our agent can learn a
competitive policy across multiple decision dimensions, which outperforms
state-of-the-art policies on public datasets.
- Abstract(参考訳): 視覚データをストリーミングしたり、知覚をストリーミングしたりするコンピュータビジョンモデルの実行は、自動運転、具体化エージェント、拡張現実/バーチャルリアリティーなど、新たな問題である。
このようなシステムの開発は、処理パイプラインの精度とレイテンシに大きく左右される。
過去の開発では、多くの近似実行フレームワークが提案されているが、決定機能は、レイテンシ、正確性、エネルギーなどの最適化にのみ焦点を絞っている。
その結果、システム全体のパフォーマンスに影響を与える最適化を下すことになる。
ストリーミング認識システムはシステム全体の性能(すなわち、精度とレイテンシの両方を同時に考慮して)を総括的に最大化するべきである。
この目的のために,ストリーミング知覚のための実行時にこれらのトレードオフを学ぶための,深層強化学習に基づく新しいアプローチについて述べる。
このトレードオフ最適化は,新たな深層バンディット問題として定式化されており,遅延と精度を1つのメトリックに統合した新たな報酬関数を設計する。
エージェントは、パブリックデータセットの最先端ポリシーよりも優れた、複数の意思決定次元にわたる競合ポリシーを学習できることを示します。
関連論文リスト
- Understanding Optimization in Deep Learning with Central Flows [53.66160508990508]
RMSの暗黙的な振る舞いは、微分方程式の「中央流:」によって明示的に捉えられることを示す。
これらのフローは、汎用ニューラルネットワークの長期最適化軌道を経験的に予測できることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:13Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - Successive Refinement in Large-Scale Computation: Advancing Model
Inference Applications [67.76749044675721]
階層化分解能計算の解を導入する。
これらの解により、最終結果よりも早い段階でより解像度の低い結果が得られる。
論文 参考訳(メタデータ) (2024-02-11T15:36:33Z) - Adaptive Decision-Making with Constraints and Dependent Losses:
Performance Guarantees and Applications to Online and Nonlinear
Identification [5.787117733071415]
エージェントが有限の選択肢の中から繰り返し選択することで累積性能目標を最適化する適応的意思決定問題を考える。
我々のアルゴリズムと分析はインスタンス依存であり、つまり、環境の最適以下の選択は、我々の後悔の限界に利用され、反映される。
得られたアルゴリズムの性能は2つの数値例で強調される。
論文 参考訳(メタデータ) (2023-04-06T18:32:26Z) - Adaptive Information Belief Space Planning [9.365993173260316]
我々は、不確実性に明示的に対処する報酬関数を使用して、情報決定を効率的に行うことに重点を置いている。
期待される情報理論の報奨関数と結果の値関数のバウンダリを導出する。
そこで我々は,計算時間のごく一部で同一の動作選択を実現するために集約を洗練させる手法を提案する。
論文 参考訳(メタデータ) (2022-01-14T21:12:00Z) - Learning-based decentralized offloading decision making in an
adversarial environment [1.9978675755638664]
Vehicular fog Computing (VFC) は、クラウドコンピューティング機能をインターネットの端にある分散フォグノードにプッシュする。
本稿では,対戦型マルチアームバンディット理論に基づく,バンドリットフィードバックを用いた新しい逆オンラインアルゴリズムを開発する。
理論的には、入力サイズ依存選択規則は、準最適動作を探索することなく、適切な霧ノードを選択することができる。
論文 参考訳(メタデータ) (2021-04-26T19:04:55Z) - Towards Streaming Perception [70.68520310095155]
本稿では、リアルタイムオンライン知覚のための単一のメトリクスにレイテンシと精度を協調的に統合するアプローチを提案する。
この指標の背後にある重要な洞察は、瞬間ごとに認識スタック全体の出力を共同で評価することである。
本稿では,都市ビデオストリームにおけるオブジェクト検出とインスタンスセグメンテーションの具体的タスクに注目し,高品質で時間依存的なアノテーションを備えた新しいデータセットを寄贈する。
論文 参考訳(メタデータ) (2020-05-21T01:51:35Z) - Learning with Differentiable Perturbed Optimizers [54.351317101356614]
本稿では,操作を微分可能で局所的に一定ではない操作に変換する手法を提案する。
提案手法は摂動に依拠し,既存の解法とともに容易に利用することができる。
本稿では,この枠組みが,構造化予測において発達した損失の族とどのように結びつくかを示し,学習課題におけるそれらの使用に関する理論的保証を与える。
論文 参考訳(メタデータ) (2020-02-20T11:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。