論文の概要: Online Convex Optimization in Changing Environments and its Application
to Resource Allocation
- arxiv url: http://arxiv.org/abs/2009.14436v1
- Date: Wed, 30 Sep 2020 04:53:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 22:44:12.332673
- Title: Online Convex Optimization in Changing Environments and its Application
to Resource Allocation
- Title(参考訳): 環境変化におけるオンライン凸最適化と資源配分への応用
- Authors: Jianjun Yuan
- Abstract要約: Online Convex Optimization (OCO)は、シーケンシャルなデータ処理要件に適合する人気のあるフレームワークである。
本論文では,OCOの環境に適応するアルゴリズムを設計することで,OCO開発への貢献を示す。
- 参考スコア(独自算出の注目度): 7.919213739992463
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the era of the big data, we create and collect lots of data from all
different kinds of sources: the Internet, the sensors, the consumer market, and
so on. Many of the data are coming sequentially, and would like to be processed
and understood quickly. One classic way of analyzing data is based on batch
processing, in which the data is stored and analyzed in an offline fashion.
However, when the volume of the data is too large, it is much more difficult
and time-consuming to do batch processing than sequential processing. What's
more, sequential data is usually changing dynamically, and needs to be
understood on-the-fly in order to capture the changes. Online Convex
Optimization (OCO) is a popular framework that matches the above sequential
data processing requirement. Applications using OCO include online routing,
online auctions, online classification and regression, as well as online
resource allocation. Due to the general applicability of OCO to the sequential
data and the rigorous theoretical guarantee, it has attracted lots of
researchers to develop useful algorithms to fulfill different needs. In this
thesis, we show our contributions to OCO's development by designing algorithms
to adapt to changing environments.
- Abstract(参考訳): ビッグデータの時代、私たちはインターネット、センサー、消費者市場など、あらゆる種類のソースから大量のデータを作成し、収集します。
多くのデータが順次やってくるので、迅速に処理して理解したいと考えています。
データ分析の古典的な方法の1つは、データをオフラインで保存して分析するバッチ処理に基づいている。
しかし、データのボリュームが大きすぎると、シーケンシャルな処理よりもバッチ処理が難しく、時間がかかります。
さらに、シーケンシャルなデータは一般的に動的に変化しており、変更をキャプチャするためにオンザフライで理解する必要があります。
Online Convex Optimization (OCO)は、上記のシーケンシャルなデータ処理要件に適合する人気のあるフレームワークである。
OCOを使用するアプリケーションは、オンラインルーティング、オンラインオークション、オンライン分類と回帰、およびオンラインリソース割り当てを含む。
シーケンシャルデータに対するOCOの適用性と厳密な理論的保証により、多くの研究者が異なるニーズを満たすための有用なアルゴリズムを開発してきた。
本稿では,OCOの環境に適応するアルゴリズムを設計することで,OCO開発への貢献を示す。
関連論文リスト
- Online Parallel Multi-Task Relationship Learning via Alternating Direction Method of Multipliers [37.859185005986056]
オンラインマルチタスク学習(OMTL)は、複数のタスク間の固有の関係を活用することで、ストリーミングデータ処理を強化する。
本研究では、分散コンピューティング環境に適した最近の最適化である交互方向乗算器法(ADMM)に基づく新しいOMTLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-09T10:20:13Z) - RPS: A Generic Reservoir Patterns Sampler [1.09784964592609]
本稿では,ストリーミングバッチデータからの直接パターンサンプリングを容易にするために,重み付き貯水池を利用する手法を提案する。
本稿では、時間的バイアスに対処し、逐次的、重み付け、および非重み付けを含む様々なパターンタイプを処理できる汎用アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-31T16:25:21Z) - Adaptive Data Optimization: Dynamic Sample Selection with Scaling Laws [59.03420759554073]
本稿では,オンライン手法でデータ分散を最適化するアルゴリズムであるAdaptive Data Optimization (ADO)を導入する。
ADOは外部の知識やプロキシモデル、モデル更新の変更を必要としない。
ADOは、ドメインごとのスケーリング法則を使用して、トレーニング中の各ドメインの学習ポテンシャルを推定し、データ混合を調整する。
論文 参考訳(メタデータ) (2024-10-15T17:47:44Z) - D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning [99.33607114541861]
ロボット操作と移動環境の現実的なシミュレーションに焦点を当てたオフラインRLのための新しいベンチマークを提案する。
提案するベンチマークでは、状態ベースドメインと画像ベースドメインを対象とし、オフラインRLとオンライン微調整評価の両方をサポートしている。
論文 参考訳(メタデータ) (2024-08-15T22:27:00Z) - Improving information retention in large scale online continual learning [99.73847522194549]
オンライン連続学習は、既存の知識を維持しながら、新しいデータに効率的に適応することを目的としている。
最近の研究は、リプレイバッファが無制限であっても、大規模なOCLでは情報保持が問題であり続けていることを示唆している。
非定常目標に対する最適化を改善するため,移動平均の手法群を提案する。
論文 参考訳(メタデータ) (2022-10-12T16:59:43Z) - Where Is My Training Bottleneck? Hidden Trade-Offs in Deep Learning
Preprocessing Pipelines [77.45213180689952]
ディープラーニングにおける前処理パイプラインは、トレーニングプロセスを忙しくするための十分なデータスループットの提供を目的としている。
エンドツーエンドのディープラーニングパイプラインのためのデータセットを効率的に準備する新たな視点を導入する。
チューニングされていないシステムに比べてスループットが3倍から13倍に向上する。
論文 参考訳(メタデータ) (2022-02-17T14:31:58Z) - Dynamic Network-Assisted D2D-Aided Coded Distributed Learning [59.29409589861241]
本稿では,デバイス間のロードバランシングのための新しいデバイス・ツー・デバイス(D2D)支援型符号化学習手法(D2D-CFL)を提案する。
最小処理時間を達成するための最適圧縮率を導出し、収束時間との接続を確立する。
提案手法は,ユーザが継続的にトレーニングデータを生成するリアルタイム協調アプリケーションに有用である。
論文 参考訳(メタデータ) (2021-11-26T18:44:59Z) - Evaluation of Load Prediction Techniques for Distributed Stream
Processing [0.0]
分散ストリーム処理(DSP)システムは、連続データの大きなストリームを処理し、ほぼリアルタイムで結果を生成する。
DSPシステムにイベントが到着する速度は、時間とともに大きく変化する可能性がある。
入ってくるワークロードの事前知識は、リソース管理と最適化に対する積極的なアプローチを可能にする。
論文 参考訳(メタデータ) (2021-08-10T15:25:32Z) - Critic Regularized Regression [70.8487887738354]
批判正規化回帰(CRR)形式を用いてデータからポリシーを学習するための新しいオフラインRLアルゴリズムを提案する。
CRRは驚くほどよく動作し、高次元の状態と行動空間を持つタスクにスケールする。
論文 参考訳(メタデータ) (2020-06-26T17:50:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。