論文の概要: Asymptotically Fair Participation in Machine Learning Models: an Optimal
Control Perspective
- arxiv url: http://arxiv.org/abs/2311.10223v1
- Date: Thu, 16 Nov 2023 22:28:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 15:25:33.742864
- Title: Asymptotically Fair Participation in Machine Learning Models: an Optimal
Control Perspective
- Title(参考訳): 機械学習モデルにおける漸近的に公平な参加--最適制御視点
- Authors: Zhuotong Chen and Qianxiao Li and Zheng Zhang
- Abstract要約: 最先端の機械学習モデルのパフォーマンスは、トレーニングデータセットで表現されていない人口層をテストすると、しばしば低下する。
我々は,最適制御の定式化を通じて,巧妙に公正な参加を実現することの課題に対処することを目的とする。
最適制御解を推定するために、ポントリャーギンの最大原理の効率的な実装を適用する。
- 参考スコア(独自算出の注目度): 21.962258178900065
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The performance of state-of-the-art machine learning models often
deteriorates when testing on demographics that are under-represented in the
training dataset. This problem has predominately been studied in a supervised
learning setting where the data distribution is static. However, real-world
applications often involve distribution shifts caused by the deployed models.
For instance, the performance disparity against monitory users can lead to a
high customer churn rate, thus the available data provided by active users are
skewed due to the lack of minority users. This feedback effect further
exacerbates the disparity among different demographic groups in future steps.
To address this issue, we propose asymptotically fair participation as a
condition to maintain long-term model performance over all demographic groups.
In this work, we aim to address the problem of achieving asymptotically fair
participation via optimal control formulation. Moreover, we design a surrogate
retention system based on existing literature on evolutionary population
dynamics to approximate the dynamics of distribution shifts on active user
counts, from which the objective of achieving asymptotically fair participation
is formulated as an optimal control problem, and the control variables are
considered as the model parameters. We apply an efficient implementation of
Pontryagin's maximum principle to estimate the optimal control solution. To
evaluate the effectiveness of the proposed method, we design a generic
simulation environment that simulates the population dynamics of the feedback
effect between user retention and model performance. When we deploy the
resulting models to the simulation environment, the optimal control solution
accounts for long-term planning and leads to superior performance compared with
existing baseline methods.
- Abstract(参考訳): 最先端の機械学習モデルのパフォーマンスは、トレーニングデータセットで表現されていない人口層をテストすると、しばしば低下する。
この問題は、データ分布が静的な教師あり学習環境で主に研究されている。
しかし、現実世界のアプリケーションは、しばしばデプロイされたモデルによって引き起こされる分散シフトを伴う。
例えば、監視対象ユーザに対するパフォーマンス格差は、高い顧客チャーン率につながる可能性があるため、アクティブユーザによって提供されるデータは、少数ユーザの欠如によって歪められる。
このフィードバック効果は、将来の段階における異なる人口集団間の格差をさらに悪化させる。
この問題に対処するため,全人口集団における長期モデル性能を維持する条件として,漸近的公正参加を提案する。
本研究では,最適制御の定式化による漸近的公正な参加の実現を課題とする。
さらに, アクティブユーザ数における分布シフトのダイナミクスを近似し, 漸近的に公平に参加する目的を最適制御問題として定式化し, 制御変数をモデルパラメータとして考えるように, 既存の進化的集団動態に基づくサーロゲート保持システムを設計する。
最適制御解を推定するために,pontryaginの最大原理の効率的な実装を適用する。
提案手法の有効性を評価するために,ユーザ保持とモデル性能のフィードバック効果の個体群動態をシミュレートする汎用シミュレーション環境を設計した。
結果のモデルをシミュレーション環境にデプロイする場合、最適制御ソリューションは長期計画に責任を持ち、既存のベースライン手法と比較して優れた性能をもたらす。
関連論文リスト
- MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - ReCoRe: Regularized Contrastive Representation Learning of World Model [21.29132219042405]
対照的な教師なし学習と介入不変正規化器を用いて不変特徴を学習する世界モデルを提案する。
提案手法は,現状のモデルベースおよびモデルフリーのRL法より優れ,iGibsonベンチマークで評価された分布外ナビゲーションタスクを大幅に改善する。
論文 参考訳(メタデータ) (2023-12-14T15:53:07Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Building Resilience to Out-of-Distribution Visual Data via Input
Optimization and Model Finetuning [13.804184845195296]
本稿では,特定の目標視モデルに対する入力データを最適化する前処理モデルを提案する。
自律走行車におけるセマンティックセグメンテーションの文脈におけるアウト・オブ・ディストリビューションシナリオについて検討する。
提案手法により, 微調整モデルに匹敵するデータの性能を実現できることを示す。
論文 参考訳(メタデータ) (2022-11-29T14:06:35Z) - An Information-Theoretic Approach for Estimating Scenario Generalization
in Crowd Motion Prediction [27.10815774845461]
本稿では,ソース・クラウド・シナリオに基づいて学習したモデルの一般化を特徴付ける新しいスコアリング手法を提案する。
インタラクションコンポーネントはシナリオドメインの難易度を特徴付けることを目的としており、シナリオドメインの多様性はダイバーシティスコアで取得される。
提案手法の有効性をシミュレーションおよび実世界(ソース,ターゲット)の一般化タスクで検証した。
論文 参考訳(メタデータ) (2022-11-02T01:39:30Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Adaptive Sampling Strategies to Construct Equitable Training Datasets [0.7036032466145111]
コンピュータビジョンから自然言語処理までの領域では、機械学習モデルがスタークの相違を示すことが示されている。
これらのパフォーマンスギャップに寄与する要因の1つは、モデルがトレーニングしたデータに表現力の欠如である。
公平なトレーニングデータセットを作成する際の問題を形式化し、この問題に対処するための統計的枠組みを提案する。
論文 参考訳(メタデータ) (2022-01-31T19:19:30Z) - Dream to Explore: Adaptive Simulations for Autonomous Systems [3.0664963196464448]
ベイズ的非パラメトリック法を適用し,力学系制御の学習に挑戦する。
ガウス過程を用いて潜在世界力学を探索することにより、強化学習で観測される一般的なデータ効率の問題を緩和する。
本アルゴリズムは,ログの変動的下界を最適化することにより,世界モデルと政策を共同で学習する。
論文 参考訳(メタデータ) (2021-10-27T04:27:28Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。