論文の概要: Online Omniprediction with Long-Term Constraints
- arxiv url: http://arxiv.org/abs/2509.11357v1
- Date: Sun, 14 Sep 2025 17:22:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.047235
- Title: Online Omniprediction with Long-Term Constraints
- Title(参考訳): 長期制約のあるオンラインOmniprediction
- Authors: Yahav Bechavod, Jiuyao Lu, Aaron Roth,
- Abstract要約: 本稿では,長期的制約を伴うオンライン全滅の問題について検討する。
我々は、下流のエージェントがこれを保証できるように、一つの予測セットを作る方法を示す。
我々はまた、保証を任意の文脈で定義された偶数列に拡張する方法も示している。
- 参考スコア(独自算出の注目度): 13.637004009810285
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce and study the problem of online omniprediction with long-term constraints. At each round, a forecaster is tasked with generating predictions for an underlying (adaptively, adversarially chosen) state that are broadcast to a collection of downstream agents, who must each choose an action. Each of the downstream agents has both a utility function mapping actions and state to utilities, and a vector-valued constraint function mapping actions and states to vector-valued costs. The utility and constraint functions can arbitrarily differ across downstream agents. Their goal is to choose actions that guarantee themselves no regret while simultaneously guaranteeing that they do not cumulatively violate the constraints across time. We show how to make a single set of predictions so that each of the downstream agents can guarantee this by acting as a simple function of the predictions, guaranteeing each of them $\tilde{O}(\sqrt{T})$ regret and $O(1)$ cumulative constraint violation. We also show how to extend our guarantees to arbitrary intersecting contextually defined \emph{subsequences}, guaranteeing each agent both regret and constraint violation bounds not just marginally, but simultaneously on each subsequence, against a benchmark set of actions simultaneously tailored to each subsequence.
- Abstract(参考訳): 本稿では,長期的制約のあるオンライン全滅問題を紹介し,研究する。
各ラウンドにおいて、予測者は、下流のエージェントの集合に放送される基礎となる(適応的に、逆選択された)状態の予測を生成することを任務とし、それぞれがアクションを選択する必要がある。
各下流エージェントは、ユーティリティ関数マッピングアクションとユーティリティへのステートと、ベクトル値の制約関数マッピングアクションと、ベクトル値のコストに対するステートの両方を持っている。
ユーティリティ関数と制約関数は、下流エージェント間で任意に異なる。
彼らのゴールは、後悔しないことを保証し、同時に時間をかけて制限を累積的に違反しないことを保証する行動を選択することである。
我々は、各下流エージェントが予測の単純な関数として振る舞うことでこれを保証できるように、単一の予測セットを作る方法を示し、それぞれが$\tilde{O}(\sqrt{T})$ regretおよび$O(1)$ cumulative constraint violationを保証します。
また,各エージェントが各サブシーケンスに対して同時に調整された動作のベンチマークセットに対して,残効と制約違反の双方のバウンダリを保証するために,任意のコンテキスト定義の \emph{subsequences} に我々の保証を拡張する方法を示す。
関連論文リスト
- Core Safety Values for Provably Corrigible Agents [2.6451153531057985]
我々は,複数段階の部分的に観察された環境において,検証可能な保証を付与し,適応性のための最初の実装可能なフレームワークを紹介した。
私たちのフレームワークは、単一の報酬を5つの*構造的に分離された*ユーティリティヘッドに置き換えます。
敵がエージェントを修正できるオープンエンド設定では、任意のポストハックエージェントが調整性に反するかどうかを判断することは不可能である。
論文 参考訳(メタデータ) (2025-07-28T16:19:25Z) - An Optimistic Algorithm for Online Convex Optimization with Adversarial Constraints [55.2480439325792]
逆制約を伴うオンライン凸最適化(OCO)について検討する。
本稿では,損失関数と制約関数の予測にアルゴリズムがアクセス可能な設定に着目する。
以上の結果から,現在のO(sqrtT) $ regret と $ tildeO(sqrtT) $ cumulative constraint violation の改善が期待できることがわかった。
論文 参考訳(メタデータ) (2024-12-11T03:06:42Z) - Robust Yet Efficient Conformal Prediction Sets [53.78604391939934]
コンフォーマル予測(CP)は、任意のモデルの出力を真のラベルを含むことが保証された予測セットに変換することができる。
整合性スコアの最悪のケース変化をバウンドすることで、証明可能なロバストな集合を導出する。
論文 参考訳(メタデータ) (2024-07-12T10:59:44Z) - On Dynamic Regret and Constraint Violations in Constrained Online Convex
Optimization [17.412117389855222]
提案するアルゴリズムは,現在の動作の周囲に適度に選択された集合上の射影勾配勾配を追従する。
動的後悔と制約違反の両方が、連続する最適動作間の距離の和であるパス長によって順序的に束縛されていることを示す。
論文 参考訳(メタデータ) (2023-01-24T04:22:13Z) - Autoregressive Bandits [58.46584210388307]
本稿では,オンライン学習環境であるAutoregressive Banditsを提案する。
報酬プロセスの軽微な仮定の下では、最適ポリシーを便利に計算できることが示される。
次に、新しい楽観的後悔最小化アルゴリズム、すなわちAutoRegressive Upper Confidence Bound (AR-UCB)を考案し、$widetildemathcalO left( frac(k+1)3/2sqrtnT (1-G)のサブ線形後悔を被る。
論文 参考訳(メタデータ) (2022-12-12T21:37:36Z) - Once-for-All Sequence Compression for Self-Supervised Speech Models [62.60723685118747]
自己教師型音声モデルのための一括圧縮フレームワークを提案する。
このフレームワークは様々なタスクで評価され、固定圧縮率の変種と比較して限界劣化を示す。
また、適応圧縮率学習についても検討し、グリッド探索を必要とせず、タスク固有の好ましいフレーム期間を選択する能力を示す。
論文 参考訳(メタデータ) (2022-11-04T09:19:13Z) - Batch Multivalid Conformal Prediction [13.077246342082294]
我々は,バッチ設定における交換可能なデータに対する多値カバレッジを得るために,高速な分布自由な共形予測アルゴリズムを開発した。
いずれのアルゴリズムも任意の非整合点を入力として取り、おそらく交差する群の任意の集合を与える。
両アルゴリズムの性能を広範囲な実験で評価する。
論文 参考訳(メタデータ) (2022-09-30T00:18:27Z) - A Unifying Framework for Online Optimization with Long-Term Constraints [62.35194099438855]
我々は,意思決定者が長期的制約の対象となる一連の意思決定をしなければならないオンライン学習問題について検討する。
目標は、全報酬を最大化し、同時に、$T$ラウンド全体で小さな累積違反を達成することである。
本稿では,この一般クラス問題に対して,未知のモデルに基づいて報酬と制約が選択された場合と,各ラウンドで敵が選択した場合の双方において,最良世界型アルゴリズムを提示する。
論文 参考訳(メタデータ) (2022-09-15T16:59:19Z) - Regret and Cumulative Constraint Violation Analysis for Distributed
Online Constrained Convex Optimization [24.97580261894342]
本稿では,エージェントネットワーク上の時間的制約を伴う分散オンライン凸最適化問題について考察する。
フルインフォメーションとバンディットフィードバックの2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-05-01T18:28:53Z) - Contract Scheduling With Predictions [12.335698325757491]
割り込みに関する誤った予測がある可能性のある設定について検討する。
いずれの設定においても、ロバスト性(逆予測を仮定する最悪の性能)と一貫性(予測がエラーのないと仮定する性能)のトレードオフを調査する。
論文 参考訳(メタデータ) (2020-11-24T23:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。