論文の概要: Design and Scheduling of an AI-based Queueing System
- arxiv url: http://arxiv.org/abs/2406.06855v1
- Date: Tue, 11 Jun 2024 00:01:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 19:46:28.868672
- Title: Design and Scheduling of an AI-based Queueing System
- Title(参考訳): AIに基づく待ち行列システムの設計とスケジューリング
- Authors: Jiung Lee, Hongseok Namkoong, Yibo Zeng,
- Abstract要約: 本稿では,ジョブのクラスを予測モデルを用いて推定する大規模キューシステムについて考察する。
交通渋滞における誤予測が混雑コストに与える影響を特徴付けることにより,予測されたクラス情報をほぼ最適に組み込んだインデックスベースのポリシーを設計する。
- 参考スコア(独自算出の注目度): 12.763457245603824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To leverage prediction models to make optimal scheduling decisions in service systems, we must understand how predictive errors impact congestion due to externalities on the delay of other jobs. Motivated by applications where prediction models interact with human servers (e.g., content moderation), we consider a large queueing system comprising of many single server queues where the class of a job is estimated using a prediction model. By characterizing the impact of mispredictions on congestion cost in heavy traffic, we design an index-based policy that incorporates the predicted class information in a near-optimal manner. Our theoretical results guide the design of predictive models by providing a simple model selection procedure with downstream queueing performance as a central concern, and offer novel insights on how to design queueing systems with AI-based triage. We illustrate our framework on a content moderation task based on real online comments, where we construct toxicity classifiers by finetuning large language models.
- Abstract(参考訳): サービスシステムにおける予測モデルを利用して最適なスケジューリング決定を行うためには,外部性による混雑の予測誤差が他のジョブの遅延に与える影響を理解する必要がある。
予測モデルがヒューマンサーバと相互作用するアプリケーション(例えば、コンテンツモデレーション)によって動機づけられた本研究では、ジョブのクラスを予測モデルを用いて推定する多数の単一サーバキューからなる大規模キューシステムについて考察する。
交通渋滞における誤予測が混雑コストに与える影響を特徴付けることにより,予測されたクラス情報をほぼ最適に組み込んだインデックスベースのポリシーを設計する。
我々の理論的結果は、下流の待ち行列性能を中心とする単純なモデル選択手順を提供することで予測モデルの設計をガイドし、AIベースのトリアージを用いた待ち行列システムの設計方法に関する新たな洞察を提供する。
実際のオンラインコメントをベースとしたコンテンツモデレーションタスクにおいて,大規模言語モデルを微調整して毒性分類器を構築する。
関連論文リスト
- Revisiting SMoE Language Models by Evaluating Inefficiencies with Task Specific Expert Pruning [78.72226641279863]
SMOE(Sparse Mixture of Expert)モデルは、言語モデリングにおける高密度モデルに代わるスケーラブルな代替品として登場した。
本研究は,SMoEアーキテクチャの設計に関する意思決定を行うために,タスク固有のモデルプルーニングについて検討する。
適応型タスク対応プルーニング手法 UNCURL を導入し,MoE 層当たりの専門家数をオフラインで学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T22:35:03Z) - Third-Party Language Model Performance Prediction from Instruction [59.574169249307054]
言語モデルに基づく命令フォローシステムは、最近、多くのベンチマークタスクのパフォーマンスが向上している。
ユーザは、応答が正確かどうかを判断することなく、命令付きモデルを容易に促すことができる。
本稿では,タスク上での指示追従システムの評価から得られたメトリックを予測するために,別のモデルを訓練した第三者のパフォーマンス予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:53:47Z) - Unleash the Power of Context: Enhancing Large-Scale Recommender Systems
with Context-Based Prediction Models [2.3267858167388775]
コンテキストベース予測モデルは、ユーザの行動の確率を、ユーザとコンテキストの特徴にのみ依存することによって決定する。
我々は、クリック確率を推定するために補助的なコンテキストベースモデルを訓練することを含む、このモデリングアプローチのための多くの貴重な応用を特定した。
論文 参考訳(メタデータ) (2023-07-25T07:57:12Z) - GNN-based Passenger Request Prediction [0.3480973072524161]
本稿では,乗客のオリジン・デスティネーション(OD)フローを予測するために,意識メカニズムとともにグラフニューラルネットワークフレームワークを開発する。
提案するフレームワークは,異なる場所から発生する要求の間に発生する線形および非線形の依存関係を利用する。
道路網をカバーするグリッドセルの最適サイズは、モデルの複雑さと精度を保っている。
論文 参考訳(メタデータ) (2023-01-06T14:04:46Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z) - A Meta-learning based Distribution System Load Forecasting Model
Selection Framework [6.499433762038562]
フレームワークには、機能抽出、候補モデルラベリング、オフライントレーニング、オンラインモデルレコメンデーションといったプロセスが含まれている。
ユーザ負荷予測ニーズを入力機能として使用することにより,複数のメタ学習者が,予測精度に基づいて利用可能な負荷予測モデルをランク付けする。
スコアリング投票機構は、各メタレナーからのレコメンデーションを重み付け、最終的なレコメンデーションを作成する。
論文 参考訳(メタデータ) (2020-09-25T01:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。