Fugu-MT 論文翻訳(概要): Active Learning for Fair and Stable Online Allocations

論文の概要: Active Learning for Fair and Stable Online Allocations

arxiv url: http://arxiv.org/abs/2406.14784v1
Date: Thu, 20 Jun 2024 23:23:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-24 15:12:21.106441
Title: Active Learning for Fair and Stable Online Allocations
Title（参考訳）: 公平で安定したオンラインアロケーションのためのアクティブラーニング
Authors: Riddhiman Bhattacharya, Thanh Nguyen, Will Wei Sun, Mohit Tawarmalani,
Abstract要約: 我々は、オンラインリソース割り当てプロセスの各エポックにおいて、エージェントの特定のサブセットからのフィードバックを検討する。提案アルゴリズムは,様々な測度に対して,時系列のサブ線形な後悔境界を提供する。我々は,効率的な意思決定には広範なフィードバックは必要とせず,様々な問題クラスに対して効率的な結果をもたらすことを示した。
参考スコア（独自算出の注目度）: 6.23798328186465
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We explore an active learning approach for dynamic fair resource allocation problems. Unlike previous work that assumes full feedback from all agents on their allocations, we consider feedback from a select subset of agents at each epoch of the online resource allocation process. Despite this restriction, our proposed algorithms provide regret bounds that are sub-linear in number of time-periods for various measures that include fairness metrics commonly used in resource allocation problems and stability considerations in matching mechanisms. The key insight of our algorithms lies in adaptively identifying the most informative feedback using dueling upper and lower confidence bounds. With this strategy, we show that efficient decision-making does not require extensive feedback and produces efficient outcomes for a variety of problem classes.
Abstract（参考訳）: 本研究では,動的フェアリソース割り当て問題に対するアクティブな学習手法について検討する。割り当てに関するすべてのエージェントからの完全なフィードバックを仮定する以前の作業とは異なり、オンラインリソース割り当てプロセスの各エポックにおいて、特定のエージェントのサブセットからのフィードバックを検討する。この制限にもかかわらず,提案アルゴリズムは資源配分問題によく用いられる公平度測定値やマッチング機構の安定性考慮値など,様々な測度に対して,時系列のサブ線形な後悔境界を提供する。我々のアルゴリズムの重要な洞察は、最上位と下位の信頼境界を用いた最も情報性の高いフィードバックを適応的に識別することにある。この戦略により、効率的な意思決定は広範囲なフィードバックを必要としず、様々な問題クラスに対して効率的な結果をもたらすことが示される。

関連論文リスト

Locally Adaptive Multi-Objective Learning [50.29753546978998]
私たちは、データの分散が時間とともに任意に変化するようなオンライン環境で作業しています。この問題に対する既存のアプローチは、時間軸全体にわたって目的の集合を最小化することを目的としている。本稿では,多目的学習法の一部を適応型オンラインアルゴリズムに置き換えることで,局所適応性を実現する方法を検討する。
論文参考訳（メタデータ） (2026-02-16T17:31:48Z)
Bi-Level Contextual Bandits for Individualized Resource Allocation under Delayed Feedback [3.0294344089697596]
本稿では,遅延フィードバック下での資源割り当てを個別化するための,新しい双方向コンテキスト帯域化フレームワークを提案する。本研究は, 制度政策と社会福祉を改善するための遅延認識型意思決定システムの可能性を明らかにするものである。
論文参考訳（メタデータ） (2025-11-13T18:09:08Z)
Towards Principled Unsupervised Multi-Agent Reinforcement Learning [49.533774397707056]
実践的な設定でこの問題に対処するために,スケーラブルで分散化された信頼領域ポリシー探索アルゴリズムを提案する。本研究では,特定の目的,すなわち混合エントロピーの最適化が,トラクタビリティと性能のトレードオフに優れたものであることを示す。
論文参考訳（メタデータ） (2025-02-12T12:51:36Z)
DECAF: Learning to be Fair in Multi-agent Resource Allocation [4.788163807490197]
本研究では,資源集中配置における公平かつ効率的な政策を学習するための手法を提案する。提案手法は,マルチエージェントシステムにおける公平性のための新しい,汎用的なフレームワークにおいて,長期的公正性学習に適用される。
論文参考訳（メタデータ） (2025-02-06T18:29:11Z)
Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文参考訳（メタデータ） (2023-10-28T05:59:43Z)
Evolutionary Optimization for Proactive and Dynamic Computing Resource Allocation in Open Radio Access Network [4.9711284100869815]
Open Radio Access Network (O-RAN) におけるコンピュータリソースの自動割り当てを実現するためのインテリジェントな技術が求められているこのリソース割り当て問題を解決するための既存の問題定式化は、リソースのキャパシティユーティリティを不適切な方法で定義しているため不適切である。問題をよりよく記述した新しい定式化が提案されている。
論文参考訳（メタデータ） (2022-01-12T08:52:04Z)
MCDAL: Maximum Classifier Discrepancy for Active Learning [74.73133545019877]
近年の最先端のアクティブラーニング手法は, 主にGAN(Generative Adversarial Networks)をサンプル取得に活用している。本稿では,MCDAL(Maximum Discrepancy for Active Learning)と呼ぶ新しいアクティブラーニングフレームワークを提案する。特に,両者の差分を最大化することにより,より厳密な決定境界を学習する2つの補助的分類層を利用する。
論文参考訳（メタデータ） (2021-07-23T06:57:08Z)
Multi-Agent Online Optimization with Delays: Asynchronicity, Adaptivity, and Optimism [33.116006446428756]
遅延と非同期性を考慮したマルチエージェントオンライン学習問題の研究を行った。エージェントレベルとネットワークレベルの両方で、最適な後悔の境界を持つ適応学習戦略を導き出します。
論文参考訳（メタデータ） (2020-12-21T18:55:55Z)
Online Learning Demands in Max-min Fairness [91.37280766977923]
本稿では,複数のユーザ間の希少リソースの割り当て機構について,効率的で公平で戦略に準拠した方法で記述する。このメカニズムは複数のラウンドで繰り返され、各ラウンドでユーザの要求が変更される可能性がある。各ラウンドの最後には、ユーザは受け取ったアロケーションに関するフィードバックを提供し、そのメカニズムが時間の経過とともにユーザの好みを学習することを可能にする。
論文参考訳（メタデータ） (2020-12-15T22:15:20Z)
Coordinated Online Learning for Multi-Agent Systems with Coupled Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文参考訳（メタデータ） (2020-10-21T10:11:17Z)
Resource Allocation via Model-Free Deep Learning in Free Space Optical Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-07-27T17:38:51Z)
Regularized Online Allocation Problems: Fairness and Beyond [7.433931244705934]
本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
論文参考訳（メタデータ） (2020-07-01T14:24:58Z)
Valid Explanations for Learning to Rank Models [5.320400771224103]
本稿では,入力特徴の少数のサブセットをランキング決定の理由として同定するモデルに依存しない局所的説明法を提案する。我々は,選択された特徴の有無に基づいて,ランク付けに特化して説明の妥当性と完全性という新たな概念を導入する。
論文参考訳（メタデータ） (2020-04-29T06:21:56Z)
Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文参考訳（メタデータ） (2020-02-20T15:00:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。