論文の概要: Knowledge vs. Experience: Asymptotic Limits of Impatience in Edge Tenants
- arxiv url: http://arxiv.org/abs/2511.13763v1
- Date: Fri, 14 Nov 2025 11:59:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.693527
- Title: Knowledge vs. Experience: Asymptotic Limits of Impatience in Edge Tenants
- Title(参考訳): 知識と経験 : エッジテナントにおける無症候性限界
- Authors: Anthony Kiggundu, Bin Han, Hans D. Schotten,
- Abstract要約: 2つの情報フィードが2つのM/M/1システムにおけるリネギングとジョッキーリングに与える影響について検討する。
不平等なサービス率と全時間忍耐のために、総待ち時間は直線的に増加し、放棄は避けられないことを示す。
穏やかなサブ線形誤差条件下では、両方の情報モデルが同じ限界(ロバスト性)を生じる。
- 参考スコア(独自算出の注目度): 5.493621971341363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study how two information feeds, a closed-form Markov estimator of residual sojourn and an online trained actor-critic, affect reneging and jockeying in a dual M/M/1 system. Analytically, for unequal service rates and total-time patience, we show that total wait grows linearly so abandonment is inevitable and the probability of a successful jockey vanishes as the backlog approaches towards infinity. Furthermore, under a mild sub-linear error condition both information models yield the same asymptotic limits (robustness). We empirically validate these limits and quantify finite backlog differences. Our findings show that learned and analytic feeds produce different delays, reneging rates and transient jockeying behavior at practical sizes, but converge to the same asymptotic outcome implied by our theory. The results characterize when value-of-information matters (finite regimes) and when it does not (asymptotics), informing lightweight telemetry and decision-logic design for low-cost, jockeying-aware systems.
- Abstract(参考訳): 本研究は,M/M/1システムにおける2つの情報フィード,マルコフの残響のクローズドフォーム推定器とオンライン訓練されたアクター批判器が,リネギングとジョッキーングにどう影響するかを考察する。
分析的に、不平等なサービス率と全時間忍耐のために、総待ち時間は直線的に増加するので、放棄は避けられ、バックログが無限に近づくにつれて、成功した騎手の可能性は消滅する。
さらに、穏やかなサブ線形誤差条件の下では、両情報モデルは同じ漸近的限界(ロバスト性)を生じる。
これらの制限を実証的に検証し、有限のバックログの違いを定量化する。
以上の結果から,学習フィードと分析フィードは異なる遅延,反復速度,一過性の騎手動作を現実の規模で生み出すが,我々の理論によってもたらされる漸近的な結果に収束することが示唆された。
その結果、情報の価値が重要なとき(一定の状況)とそうでないとき(漸近的でないとき)を特徴付け、低コストでジョッキーなシステムのための軽量テレメトリと意思決定論理設計を行う。
関連論文リスト
- An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes [55.93922317950527]
DRQ-learnerと呼ばれる新しいメタラーナーを開発した。
DRQ-learnerは離散状態空間と連続状態空間の両方の設定に適用できます。
論文 参考訳(メタデータ) (2025-09-30T15:49:29Z) - On Minimax Estimation of Parameters in Softmax-Contaminated Mixture of Experts [66.39976432286905]
ゲーティングおよびプロンプトパラメータの最大極大推定器の収束率について検討する。
事前学習したモデルと重なり合う知識を取得すると,これらのパラメータの推定可能性が損なわれることがわかった。
論文 参考訳(メタデータ) (2025-05-24T01:30:46Z) - On Double Descent in Reinforcement Learning with LSTD and Random
Features [1.5873758872998507]
時間差分法(TD)アルゴリズムは深層強化学習(RL)において広く用いられている
ネットワークサイズと$l$-regularizationが性能に与える影響を理論的に分析する。
本研究では,2重降下現象,すなわちパラメータ/状態比の急激な低下を観察する。
論文 参考訳(メタデータ) (2023-10-09T08:33:22Z) - Doubly Robust Proximal Causal Learning for Continuous Treatments [56.05592840537398]
本稿では,カーネルベースの2倍頑健な因果学習推定器を提案する。
オラクル形式は影響関数の一貫した近似であることを示す。
次に、平均二乗誤差の観点から総合収束解析を行う。
論文 参考訳(メタデータ) (2023-09-22T12:18:53Z) - Monotonicity and Double Descent in Uncertainty Estimation with Gaussian
Processes [52.92110730286403]
限界確率はクロスバリデーションの指標を思い起こさせるべきであり、どちらもより大きな入力次元で劣化すべきである、と一般的に信じられている。
我々は,ハイパーパラメータをチューニングすることにより,入力次元と単調に改善できることを証明した。
また、クロスバリデーションの指標は、二重降下の特徴である質的に異なる挙動を示すことも証明した。
論文 参考訳(メタデータ) (2022-10-14T08:09:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。